就在刚刚,文心大模型 4.0 版本正式发布!
北京首钢园现场,李彦宏直接放话:
文心大模型 4.0 综合水平与 GPT-4 相比已经毫不逊色。
话不多说,一起来看现场演示效果。
先来段倒装 prompt:
我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作。
不仅关键信息“北京工作”放在了最后,公积金具体是在哪里交的也没有明示。
但新版文心一言完全没有被这些小陷阱坑到,顺利给出了正确答案。
生成方面,当场剪出一整段数字人口播视频,毫不费劲:
解起数学题来也得心应手,可以说是家长辅导作业神器了(doge)。
新版文心一言还现场写起了武侠小说,即使持续添加人物角色、增加戏剧冲突,也不会出现记忆混乱、前言不搭后语的情况:
如此表现,着实是让现场观众 high 了一把。
文心大模型 4.0 相关话题,也立刻被国内外网友们热议起来。
据现场介绍,相比线上 3.5 版本的文心一言,文心大模型 4.0 进步明显:仅 9 月启动小流量测试这过去的一个月,就又提升了 30%。
那么,问题来了:文心大模型 4.0 真有这么好?具体与 GPT-4 相差几何?
目前,文心大模型 4.0 已经开启邀测,量子位也在第一时间拿到了测试资格。
我们直接实测走起。
相比 GPT-4 实测效果如何?获得测试资格后,切换到文心大模型 4.0,就可以开始玩耍了。
相比文心大模型 3.5 刚出来的时候,文心大模型 4.0 现在已经进化出了