目前的GenAI有文本类、视频类、绘图类、音频类、编程类、PPT、数字人、AI搜索等形式。其中文本类的大模型,是目前GenAI最主要的应用产品。
国外有GPT、Claude、Gemini、Llama等,国内则有Kimi、通义千问、文心一言、智谱、豆包、讯飞星火、MiniMAX、百川等。
其中Kimi主打C端,自去年10月上线以来,迅速成为国产大模型的当红炸子鸡。很多人用它平替ChatGPT,不用科学上网,直接访问就能用,关键是免费!
作为Kimi系列文章的第二篇,今天我用26个问题带大家系统认识Kimi。
1、Kimi是什么?
Kimi是文本AI,又称大语言模型(LLM),是月之暗面公司基于moonshot v1模型开发的AI助手。
Kimi原来叫“Kimi chat”,有独立网址Kimi.ai,3月份后统一更名为“Kimi智能助手”。
大家不用区分Kimi chat和Kimi智能助手,一般统称Kimi。
网址:kimi.moonshot.cn
打开后,界面如下:
类似浏览器一样,界面简洁。只有对话框、对话条件、系统设置、会话模式等功能展示。
2、由哪家公司开发?
Kimi,由北京月之暗面科技有限公司开发,公司成立于2023年3月。
去年10月,月之暗面内测上线Kimi,11月向社会全面开放。上线即支持20万汉字的长上下文,相当于约30~40万token,远超当时Claude2的10万和GPT-4的3.2万。
月之暗面,英文名Moonshot AI。就如同月亮永远背对地球的那一面,因为无法被观测,引发了人类无限的想象和探索欲望。对于月之暗面而言,人工智能就是这样一个充满魅力的领域。
创始人:杨植麟、周昕宇、吴育昕、张宇韬。
CEO杨植麟,90后,喜欢摇滚。清华学霸,成绩常年霸榜年级第一,博士就读卡内基梅隆大学。师从苹果AI研究负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen。
值得一提的是,杨植麟的英文名正是叫kimi。
与他携手的周昕宇、吴育昕、张宇韬同样也不赖,分别在矿视科技、Google、Meta AI等公司做过大模型研发,也是清华和卡内基梅隆的学霸。
今年2月,月之暗面完成10亿美元融资,创国内大模型单笔融资记录。
3、Kimi的定位是什么?
Kimi,主要定位C端,主打长文本,核心功能是AI搜索+文档总结。
这与文心一言、通义千问和智谱AI走的路有所不同,他们要么是专注B端,要么是B端、C端都想要。
Kimi从一开始就坚定C端,公司的最终目标,是要在AI时代做一个超级应用。
4、Kimi是什么水准?
基于中文语境,从笔者对多个应用的使用感知来说:
长文本处理,Kimi第一。已支持20万字上下文,200万字上下文需要申请。
语言组织,Kimi稍次通义千问,比文心一言要好。
联网智能搜索,与秘塔AI平分秋色(两者定位不同),有时候比百度好用。
逻辑推理,Kimi还需要提高,不及GPT-4、Claude3。
使用热度,那肯定妥妥的Top1。
3月国产AI榜单,数据自aicpb.com
5、与GPT-4比,Kimi水平如何?
长文本方面,Kimi支持20万汉字上下文,明显优于GPT-4(仅支持3.2万)。在高效阅读、专业论文解读、翻译、资料整理与总结方面,Kimi具有明显优势,细节也抓得准。
另外在中文的理解和处理上,Kimi也比GPT、Claude、Gemini更懂国内用户。
在推理、逻辑和产品化方面,Kimi则不及GPT-4,处于基础阶段,还需提高。
从实用的角度来说,Kimi基本可以平替GPT,无需科学上网,也无需付费。
6、与文心、通义、智谱比,Kimi水平如何?
开放性上,Kimi自由很多,可以自建提示词(常用语),DIY玩法。其他大模型,基本都是官方给你弄了很多智能体,自己去找、去用,而不是让你自建智能体。
文笔上,Kimi稍逊通义千问,不输文心一言。
联网搜索和长文本处理,这是Kimi的优势,其他大模型难以企及。最近,通义千问更新了联网搜索和溯源功能,在学习Kimi。
逻辑和推理上,大家都差不多,还未赶上GPT-4。
智谱AI,专心做B端,对C端似乎不太感兴趣。
7、什么人在用Kimi?
主要是职场人、打工人,特别是自媒体人很早就用了起来。科研爱好者、老师、学生也在用。
目前,每天的使用人数在百万级别。在中文互联网应用里,还是小众产品。
8、Kimi能做什么?不能做什么?
Kimi,主打AI搜索+长文本处理。
可以做:文本分析、文本提取、内容总结、读网页、读小说、写文章、写文案、整理票据、编程等,所有围绕文字理解和输出方面的工作,Kimi都可以做。
不能做:绘图、做视频、做音频、做PPT。Kimi不能直接输出这些,但是可以辅助,比如为绘图提供提示词,为AI音乐写歌词,为PPT总结大纲,为视频写剧本……这些,Kimi都可以打辅助。
需要AI视频、绘图、音乐生成,可以看我们推荐的其他AI。
9、Kimi与搜索引擎有什么区别?
Kimi可以联网搜索,并按用户要求进行输出、总结,也可以指定搜索单一网站(site:xx域名)。
最新版,新增了脚注功能,可溯源出处。
传统搜索是基于关键词搜索,你根据标题评判是否需要点进去,广告多,经常翻好几页都找不到想要的。
Kimi的AI搜索是基于问题搜索、观点搜索,你带着问题、观点去问Kimi,直达答案,省时省心。并且还可以让Kimi按照你的格式要求进行输出,可帮助我们完成初步的信息筛选和排版。
另外,Kimi有短期记忆,它可以根据上下文来进行回答,或者给你列一些关联问题的建议,帮助我们扩散思维。
10、Kimi支持什么格式?多大?
单次会话,支持20万汉字的上下文。200万字还在内测中,需要排队申请(较难)。
文件格式支持txt、pdf、doc、xlsx、html、epub和图片。
Html,就是我们平时说的静态网页文件,可以将整个网页保存下来,发给Kimi进行总结。epub,是电子书文件。
单次会话,可以上传50个文件,每个文件不得超过100M。但总文件的字数,不得超过20万字。
比如一份上市公司年报,基本都超过了20万字,这种情况我们可以将它拆分成几个文件,分开问Kimi。
11、如何使用Kimi?
支持3种渠道:
1)网页端,访问:kimi.moonshot.cn2)APP,下载Kimi智能助手3)小程序,微信搜索Kimi智能助手
如果你使用同一个账户登陆,网页、APP和小程序三端的数据是同步的。
还支持API调用,8k上下文的模型,100万tokens只需要12元。
12、Kimi收费吗?
不收费,网页端、APP、小程序使用,都是免费的。只有API调用,收费。
13、Kimi有次数限制吗?
有。
短文本,没有限制。
长文本,普通用户只能30条/3小时,可以做任务(添加月之暗面客服,将小程序分享给3位朋友,然后截图给客服)申请80条/小时。
200万上下文,需要在首页申请,排队等待。我排了一个多月了。
14、如何与Kimi对话?
直接在对话框提问就可以了,enter发送,shift+enter换行。这是基础的对话。
高阶对话,可以自己编写提示词Prompt,与Kimi对话。
基本技巧是给Kimi一个角色提示,然后清晰描述任务和要求。
万能模板=角色+目标+工作流+输出要求+注意事项。
15、Kimi能输出什么?
Kimi可以输出文本、表格、源代码、流程图(文本描述),支持Markdown排版、引用标记和数字脚注。
不支持思维导图、可视化图表和做图、做视频,但是可以提供文本,然后通过其他工具来完成。
比如可以让Kimi总结一份Markdown大纲,然后自己复制保存文件,导进X-Mind就可直接出思维导图了。
最新更新,API开发已支持调用外部工具。比如,用户询问酒店地址时,Kimi可以直接调用地图导航工具,来给用户展示该酒店在地图上的位置及最佳路线。
16、Kimi每次输出是标准答案吗?
不是。所有GenAI,每次的回答都是生成的,内容会不一样。
没有标准答案,只有相似的答案,或者说更靠近标准答案的参考答案。
答案是否可靠,取决于提示词是否精准。提示词越精准,答案质量也就越高,越接近标准答案。
17、如何查看历史会话?
网页、APP、小程序,都是点击左上角按钮“历史会话”,即可看到所有会话。
18、历史会话保存多久?
据身边最早一批使用Kimi的朋友透露,他的所有历史会话目前都在。
也就是说,Kimi对用户的历史会话,从其上线(2023年10月)一直保留至今。
19、如何分享Kimi的回答?
点击Kimi回答下方的文字「分享」,可以进入分享功能页。
可以仅分享当前对话,也可以分享多个对话。分享形式,支持链接、文本和图片。
20、什么时候该切换新会话?
当你计划提一个新领域的新问题时,建议点击左上角的“新会话”,切换到新会话模式,让Kimi跳出此前的会话背景,给你全新回答。
21、如何调用Kimi的常用语?
点击对话框的小方盒,就可以调用常用语。
如果你没有设置常用语的话,可以roll一个官方的提示词看看效果。如果你有设置常用语,输入关键词就会自动弹出。
常用语,也就是提示词,官方给出了15个样本,供大家选择,可解决部份场景的使用。
更复杂、垂直行业的使用,还是需要自己来写提示词。
22、如何得到Kimi高质量的回答?
在第一篇中,我们带大家认识了AI的工作原理。现阶段GenAI的特性决定了,在较长的一段时间内,AI能否生成高质量的回答,都将取决于我们给出的提示词是否精准。
提示词,就是我们与大模型沟通的语言,在交互中扮演着至关重要的作用。
编写提示词,我们推荐结构化写作,懂业务+懂技术+结构化思考+工具爱好者=优秀的提示词。
关于提示词的进阶写作,我会在后面给大家分享。
23、Kimi支持语音输入、输出吗?
支持。
在Kimi APP或小程序中,可以切换语音或打字模式,还能识别英语。
Kimi的回答,也可以选择用语音播放。
网页版,目前暂不支持语音。
24、我的数据会上传给Kimi吗?
会。
为了确保服务的质量和稳定性,Kimi会在用户使用时,收集用户输入的文本数据信息。
当然,这些数据都会经过严格的加密处理,以保护用户的隐私。
所有开箱即用的大模型都是如此,除非你用开源模型自己本地化部署。
25、我应该如何用Kimi?
了解Kimi的基本使用方法,先用、先玩,先把手头上的工作用AI做起来。
把Kimi当成你的一个助手,在各个环节进行试用,然后不断调试并熟悉,直到最终的适用。
去年,这张图在AI圈热传。
我稍微改了下,目前GenAI确实还无法完成完整链路的替代,但已经能够在某些环节替代传统的工作方法。可以帮助提升15%~20%的效率,还是没问题的。
大家的对手,不是AI,而是不会使用AI的人,或者说晚使用AI的人。
包括公司,也是如此。
26、企业应该如何用Kimi?
在回答这个问题之前,建议你先冷静下来认真思考下这3个问题:
-我们是否高估了AI对世界产生的巨大影响,甚至彻底颠覆世界所需的时间?也许是的。-我们是否了解正在改变世界的AI的运行机制?也许并不。-我们是否为AI所带来的新世界秩序做好了准备?也许远远不够。
如果你的答案是不太乐观的,那AI就不是科幻,而是「神秘之术」,是一种我们无法控制、无法理解的力量(来自Ezra Klein的观点)。技术发展如此迅猛,我们没有缓慢响应的奢侈权力。
对于公司,我建议有两种打法。
第一种是明面的,也是大家都能够想到的——通过AI去改造传统业务、优化传统业务,如果你跑得快,血槽厚,那你可以凭借先手牌跑下来。
第二种是暗藏的,是完全从0到1的创新,挖掘的是隐性需求,市场空间模糊,巨头和高手想不到或看不上。
两种打法,各凭本事。明牌是存量市场,新瓶装旧酒,需要拼速度、拼刺刀、会守成。暗牌是增量市场,未被验证,需要洞察犀利、善创新、能突围。
对于第一种,公司当务之急是需要组建或改建一支AI团队,包括IT人员、提示词工程师、业务人员和高层领导,来通盘考虑战略布置和战术细节。
如果没有想好,也可以先与这个行业的领跑者、发烧友聊一聊,听听他们的意见。