文心一言，接上了全民“宫廷玉液酒” 的暗号宫廷玉液酒暗号事件之后怎么样了

发表时间：2024-10-19 05:38:14

换言之，微软的ChatGPT、谷歌的Bard以及的文心一言几乎在同一时间段内分别推出自家生成式对话产品，也可谓是恰逢其时。

尽管在这三家企业当中，推出文心一言的速度较其他两家稍逊几日，但市场仍对其抱有更大的期待——

在已站上赛场上的三家企业当中，是唯一一家中国互联网大厂。大语言模型底层所需要的深度学习、自然语言处理（NLP）等“根技术”无法短期速成，需要多年持续的投入和积累。相较于国内外众多AI创业公司，对于技术态度始终立足于“根深才能叶茂”。

文心一言已基本做到“人有我有，人有我优，以及人有我待优”，尤其是大模型比较通用等优势能力方面，如文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等等。

我们仅以文字创作、数理逻辑推算两大核心能力为例来具体看一下。

根据李彦宏的现场演示，文心一言回答问题的准确性、流畅性已具备相当高的水准。而从“以洛阳纸贵进行藏头诗创作”“用四川话复述回复”等操作来看，在一些中国文化语境下，文心一言在问题作答，甚至是对问题进行理解延伸等方面，都较GPT-4等竞品更优。

《独角兽挖掘机》给文心一言提了两个比较带梗的问题。“宫廷玉液酒多少钱一杯？”“宫廷玉液酒的下一句？”，文心一言的回答都完全get到了。同样的问题，GPT-4则一本正经将按照白酒发酵给出解答。

文心一言更懂中文是有据可依的。

作为国内最大搜索引擎，每天接受数十亿用户的搜索请求，以及其他移动生态APP的训练，超全的知识图谱让在问答和内容生成领域享有得天独厚的优势。某种角度上，文心一言也是搜索业务的历史进阶。

此外，文心一言的数理逻辑推算表现同样令人惊喜。李彦宏介绍道，“文心一言大模型的训练数据包括：万亿级网页数据、数十亿搜索数据和图片数据、百亿级语音日均调用数据，以及5500亿事实的知识图谱。”

数据规模越大，大模型越容易发生“智能涌现”，从而逐渐形成逻辑思维和推理能力，并在答题时将问题拆分成子逐步推理。这也是李彦宏向文心一言首次提问经典“鸡兔同笼”时，文心一言甚至可以判别题目本身正确与否。

02 转守为攻，百度迎战

当谷歌、微软以及越来越多“跑步”进场的新选手们，纷纷都想要在生成式AI领域大展拳脚之时，一向低调的已悄然扭转了姿态，转守为攻，以一种更加积极的方式迎接这场新的竞技——

经过不到两个月的内测，文心一言正式上线，目前申请服务测试的企业用户就已突破8万家。

首席技术官王海峰在发布会上讲道，IT技术栈发生根本性变化即“三层变四层”，包括底层的芯片、深度学习框架、大模型以及最上层的搜索及其他应用，“文心一言”则位于模型层。也是全球为数不多的全栈布局且每层都有落地产品的公司之一。

通过“文心一言”，一方面能够让上层应用更为智能化，从而在多个产业领域落地，推动商业化从而在多个产业领域落地推动商业化，另一方面能够给予底层芯片、学习框架以用户反馈，不断优化性能。

但需要提到的一点是，李彦宏和王海峰均在发布会上反复强调，大语言模型还远未到发展完善的阶段，有赖于通过真实的用户反馈，未来会加速迭代速度。为了保证用户体验，文心一言目前采取的是“邀请测试制”，后面会逐步开放给

专业财税服务推荐