原文链接: KIMI爆了!Kimi大模型到底有多强?Kimi最新评测!

AI领域的热门助手 Kimi 最近引起了广泛关注,特别是在其推出2百万字的无损上下文测试版之后,Kimi 火爆的消息甚至登上了财经新闻头条。Kimi是月之暗面公司创立的。声称该模型能处理200万的文字无损输入。并且能一口气读取20万字的文件。

下面将会从这些方便对Kimi进行分析和测试。

训练数据

ChatGPT大玩家 就立马注册了帐号,尝试其功能。

当然首先最关心的还是Kimi的训练数据。

当前Kimi的训练数据是到2023年的3月份,而最新的ChatGPT 4 Turbo的训练数据已经到了2023年12月份。GPT-4 Turbo带来的惊喜 前面也说过。越新的数据意味着模型在处理迅速发展的公共话题时,能够生成更准确、更相关的回应。例如,对新技术进步、全球事件或新兴文化现象的讨论,都能以前所未有的洞察力和准确性来处理。这一点,Kimi还需要继续提高。

但是Kimi的实时联网功能在一定程度上弥补了这个缺陷。

问答功能

Kimi的实时联网搜索互联网的资料回答问题,这一点和Bing的功能类似,也是目前国内的大模型都具备的功能。

但是Kimi无法按照要求生成图表,只能生成一些简单图表。

尝试询问今天的日期和天气

天气功能需要实时联网才可以实现。基本可以完成日常需求。

联网功能

默认情况下Kimi是开启联网功能的,当然也可以选择手动关闭联网功能。

测试Kimi的信息检索联网能力,询问有关前几天英伟达的GTC上的东西。

但是实际测试发现,Kimi的联网有限,毕竟不是专业的搜索引擎公司,搜索貌似只是从某些固定网站检索。知乎得来源占有很大的比重。所以实时联网的效果和能力并不是很好。

让Kimi描述当前比较火热的电影《周处除三害》的电影情节,显然Kimi没有理解我的意思。

文件处理

按照Kimi的说法,最多支持50个文件上传,每个文件100MB,也就是总共支持5000MB文件大小,接近5G文件大小,基本上完全可以满足各种文件大小。

于是我测试,上传了一本 84MB 的《C++ Primer 中文版(第 5 版)》PDF版本,这是一个长达的864页的文件,让Kimi进行分析和总结。

因为这本书籍是扫描版本,导致Kimi无法解析到文字,说明Kimi的图片识别和文档解析能力有限,但是目前不支持ePUB格式的文件,所以不能快速帮助我们读小说了。

继续上传一本当年明月老师编写的《明朝那些事》。书籍大小只有9MB,而且书籍是文字版本,Kimi可以成功识别到文件内容。

发现因为文本内容太长了,Kimi只能读到前12%的内容。看来Kimi的能力有需要加强

代码能力

让Kimi做一道经典的爬楼梯的问题吧。

referer:https://leetcode.cn/problems/climbing-stairs/description

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
假设你正在爬楼梯。需要 n 阶你才能到达楼顶。

每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?



示例 1:

输入:n = 2
输出:2
解释:有两种方法可以爬到楼顶。
1. 1 阶 + 1 阶
2. 2 阶
示例 2:

输入:n = 3
输出:3
解释:有三种方法可以爬到楼顶。
1. 1 阶 + 1 阶 + 1 阶
2. 1 阶 + 2 阶
3. 2 阶 + 1 阶

这是一道很基础动态规划的题目。下面是Kimi的回答。基本上回答都非常正确。从此大家刷Leetcode又多了一个好帮手了。

响应时间

可能是因为使用的人太多,或者是Kimi的并发能力有限,我在实际使用过程中发现,Kimi有时候响应速度会非常慢,偶尔还会出现拒绝回复的问题。这一点之前ChatGPT也会出现,但是现在ChatGPT很少会出现停止响应的问题。

这一点Kimi还是需要继续优化和加强。

总结

想体验更好的大语言模型,以及其他更加强大的功能。不妨可以试一下ChatGPT-4,综合对比了国内外的各种模型,才知道那种可以满足你的使用场景和需求,毕竟每个大模型都有自己擅长和适用的领域。

我用的比较多的是GPT-4,因为语音对话功能,还有GPTs商城。,并且可以进行文件分析,画图等。尤其是代码相关的能力,非常强大。作为一个程序员,每天都高强度使用GPT-4。

GPT-3是免费的,如果需要升级GPT-4的话,可以参考教程:国内如何用gpt4

参考

KIMI爆了!Kimi大模型到底有多强?Kimi最新评测!

国内如何用gpt4

OnlyFans如何订阅