重磅!百度正式发布文心一言,中国版“ChatGPT”来了! 原创 AIGC开放社区 AIGC开放社区 2023-03-16 17:46 发表于河北
北京时间3月16日下午2点,百度在北京总部召开新闻发布会,正式发布了生成式AI产品——文心一言。(API申请地址:https://cloud.baidu.com/survey_summit/wenxin.html?track=C109067&track=4016a6e2daa72dd8f416b6eba17830b31f1db02567e779da)
百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰出席了发布会,并对「文心一言」的产品功能、技术框架、产品优势、应用场景、产业发展等多个维度进行了深度解读。(大会视频:https://pan.quark.cn/s/1f50f95a6fe2#/list/share)
从现场的演示Demo来看,「文心一言」对文本的理解能力、推理能力、回答准确度、逻辑性、多模态等方面反应迅速且准确,丝毫不输ChatGPT。但李彦宏也坦言,由于「文心一言」刚推出功能方面还有很多完善和进步的空间,需要企业、用户等多方资源共同努力,才能让「文心一言」变得更好、更聪明。
文心一言五大能力,将成为新一代智能生产工具
「文心一言」拥有文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五大功能。「文心一言」大模型的训练数据包括,万亿级网页数据、数十亿次的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿的知识图谱等,使其在中文的处理方面处于全球领先地位。
在文学创作功能演示环节,李彦宏连续提问了《三体》作者是哪里人?总结一下三体核心内容,如果续写,可以从哪些角度出发?电视剧《三体》有哪些演员?主演有哪些共同点?等基于逻辑、递进式发问。
「文心一言」则根据不同的问题,从故事角度、情节内容、哲学思考、电视剧内容等连续回答了准确、丰富的答案,展示了强大的总结分析能力和推理能力。在商业文案创作、数理逻辑推算、中文理解等环节,「文心一言」皆交出了满意的答卷。
尤其是中文理解环节,「文心一言」不仅深度解释了“洛阳纸贵”这个成语的含义以及在现代经济学原理里的理论,还用洛阳纸贵四个字全新创作了一首藏头诗,全方位地展示了对中文的解读和重构能力。
多模态生成则是「文心一言」的一大技术亮点,具备根据文本提问自动生成图片,将文本转换成音频,将文本转换成视频等强大功能。例如,请为2023世界智能交通大会制作一张海报,机器人自动生成一张海报;将文本生成语音、视频都是「文心一言」的拿手好戏。
大语言模型,将带来三大产业机会
李彦宏表示,自今年2月份百度官宣发布「文心一言」以来,已超过650家企业宣布接入「文心一言」生态。各行业对生成式AI产品的需求呈爆发式增长,释放出前所未有的的商业价值并带来三大产业机会。
新型云计算:「文心一言」将根本性地改变云计算行业的游戏规则。之前,企业选择云厂商更看重算力、存储性能等基础云服务。未来,会聚焦在大语言模型、框架、芯片、应用四层之间的协同应用环境。李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕「文心一言」的云服务和应用产品,既有公有云服务,也可以做私有化部署。
行业模型精调:这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力为客户提供特定解决方案。目前,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个针对不同行业的大模型。
应用开发:对于大部分创业者和企业来说,真正的机会并不是做「文心一言」、ChatGPT这类基础式人工智能生成产品。而是通过「文心一言」开发基于文本生成、图像生成、音频生成、视频生成、数字人、3D等应用。目前,国内外已经涌现出很多明星级创业公司,具备成为行业独角兽的潜质。
「文心一言」——新一代知识增强大语言模型
在技术架构讲解环节,百度首席技术官王海峰对「文心一言」进行了深度讲解。
「文心一言」是新一代知识增强大语言模型,也是百度继文心一格之后的又一个生成式AI产品,具备对话交互、内容创作、知识推理、多模态生成等能力。
王海峰表示,新一代知识增强大语言模型「文心一言」,是在ERNIE及PLATO系列模型的基础上研发而成。关键技术包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。其中,知识增强、检索增强、对话增强是打造竞争壁垒的核心技术。
知识增强:通过知识内化和知识外用两种方式。知识内化,从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中;知识外用,引入外部多源异构知识,做知识推理、提示构建等等。
检索增强:来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。
对话增强:基于对话技术和应用积累,使得「文心一言」具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
王海强调,百度自2010年起开始全面布局人工智能,是全球为数不多、进行全栈布局的人工智能公司。从昆仑芯片、飞桨深度学习平台、文心大模型到应用,百度在技术栈的各层都有领先业界的关键自研技术,实现了层与层之间的反馈,端到端的持续优化。
3 月 16 日起,首批用户可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言 API 接口调用服务,可申请加入文心一言云服务测试。