环球短讯！文心一言「大战」ChatGPT：谁更能忽悠？

首页 > 频道 > 消费团 >

来源：新浪科技（ID:techsina）发布时间：2023-03-17 11:18:08

GPT-4发布后的第二天，百度“顶着压力”，推出了自己的新一代知识增强大语言模型——“文心一言”。

一开场，别着白色裤腰带走上舞台的百度创始人、董事长兼首席执行官李彦宏，便放低姿态道，“文心一言对标ChatGPT甚至是对标CGT-4，门槛是很高的，全球大厂还没有一个做出来，百度是第一个，我自己测试感觉还是有很多不完美的地方。”

真实的文心一言如何？新浪财经对比ChatGPT对文心一言进行实测，一窥“文心一言”发布后的真实表现。

(资料图片仅供参考)

实测：实时信息获取有亮点，内容准确性不足

在输入“北京明天天气怎么样？”“刘备和曹操谁活得更久？”等问题，以及提出“请写一篇文心一言PK ChatGPT的实测稿件”，“写一篇太空旅行的市场分析报告”，“生成一幅有马和飞机的水墨画”等操作指令后，文心一言先后给出的答案，有的表现相比此前OpenAI发布的ChatGPT也不遑多让，而有的则又相对存在不足。

提问“明天天气怎么样等问题时”，文心一言列出的数据，与目前手机上显示的数据基本一致。而由于ChatGPT此前所收集的数据仅截至2021年，并不具备查询实时数据的能力，自然也无法获取到更加精确的天气预报这一类数据。

此外，相比ChatGPT更加擅长知识回答、代码写作等能力，内测时候文心一言所具备的以文绘图能力，在一定层面上超越了ChaGPT。虽然，目前OpenAI推出的GPT4大模型已经具备多模态技术能力，同样支持以文绘画能力。不过文心一言也嵌入了以文绘图能力，这也在一定程度上验证了文心一言的创新性。

不过，在中文知识问答、绘画以及实时信息获取等亮点之外，诸如ChatGPT此前被吐槽的“一本正经地胡说八道”“知识缺乏严谨性”等问题，也同样出现在文心一言身上。

在新浪财经发出“刘备和曹操谁获得更久？”这一问题时，由于错将“活”字写成了“获”字，文心一言却开始不假思索地给出了“刘备和曹操谁获得更多？”的长篇大论。

而在新浪财经将问题更正为“刘备和曹操谁活得更久？”后，文心一言给出的解释，却多少存在一些“忽悠”的成分。

相比于百度搜索能够直接给出的结果而言，目前文心一言给出的答案在实用性上仍有改善的空间。

李彦宏亲自带队，一场必须赢的战役

文心一言发布后，各种各样的声音开始浮现。有吐槽文心一言“用录制视频做发布会演示的”，也有吐槽“文心一言与ChatGPT存在差距的”，但对于先后注册了四次海外版ChatGPT账号，但前三次已经因不明原因无法再继续使用ChatGPT账号的亲测人员而言，文心一言的出现确实有着重要的意义。

毕竟，国内也需要有一款自己的“类ChatGPT”产品。而对于百度而言，作为目前拥有国内70%以上搜索市场，同时拥有最为丰富的中文语料库的企业。文心一言的推出，既有其过去多年投入AI研究和努力的延续，但同时也是一场必须要赢的战争。

此前，在OpenAI推出ChatGPT之后，业界便开始提出“ChatGPT将取代搜索引擎”的观点。虽然短期内ChatGPT无法完全取代搜索引擎，但如果放任其发展不管，随着后续ChatGPT的用户生态和内容体系不断完善，重新改写网络搜索行业规则，也未尝不是没有可能。

据李彦宏发布会上介绍，从2019年开始，百度就推出了文心大语言模型ERNIE 1.0。目前，多次升级后的ERNIE 3.0每天接受数十亿次用户的搜索请求。这让文心一言能够基于一个庞大的、高效的数据池，快速地学习和改进。试想，百度在语言大模型领域有着如此长期的积累，而且未来ChatGPT发展起来后，最先威胁到的很可能就是作为百度基本盘的搜索类业务，他又怎么会不顾一切地推出文心一言来应对这一变化呢？

据悉，目前，文心一言是由李彦宏亲自过问、CTO王海峰挂帅的项目，两人每晚会和所有相关技术、产品人员，以及CFO、PR和GR、法务高层开会，这样的团队配置在百度也是少见的。

除百度外，目前，国内包括阿里、腾讯、字节跳动以及京东等在内的企业，均已先后披露了自家的“类ChatGPT”产品研发计划。作为国内最先发布“类ChatGPT”产品的大厂，截至目前，接入“文心一言”的生态伙伴已超过650家。

虽然文心一言的推出仍存在这样那样的问题，但至少，目前百度在这一方面的优势和领先性，是有目共睹的。文心一言后续发展将会如何？

且让子弹再飞一会儿吧！

关键词：

分享到：QQ空间新浪微博腾讯微博人人网微信

上一篇：

下一篇：