相较于去年的元宇宙,大模型无疑是今年世界人工智能大会的绝对“C位”。
(资料图片)
7月6日至8日,以“智联世界 生成未来”为主题的第六届世界人工智能大会(简称WAIC)在上海举办。会上,国内各大厂商先后推出了30多款大模型产品,涉及大语言、工业、金融、汽车、医疗等诸多领域。
千帆竞逐、百花齐放,这些亮相展会的大模型究竟如何?这次上证报记者现场从中挑选若干家较为知名的厂商产品,一个模型一句评论,带你盘点这场“大模型”的比武大赛。
百度早在2019年,就开始研发预训练大模型,并先后发布了知识增强文心(ERNIE)系列模型。截至2022年11月,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,加速推动行业的智能化转型升级。
作为百度自主研发的产业级知识增强大模型,文心大模型基于飞桨平台开源开放,具备知识增强和产业级两大特色。其中,文心一言是百度新一代的知识增强大语言模型。百度也是全球大厂中第一个做出对标ChatGPT产品的企业。
文心一言中的“文心”取自中国南朝文学理论家刘勰的作品《文心雕龙》,指的是用雕龙纹那样的细致去研究文字的内涵和魅力,寓意百度用心做文字理解的决心。在功能上,文心一言具备对话交互、内容创作、知识推理、多模态生成等能力。你可以跟它来聊天,让它给你画一幅画,或者问它一些专业上的问题,写一份策划、做一份攻略,敲一段代码等等。
评价
作为国内最早最知名的语言类大模型,从聊天和简单撰写策划来看整体符合预期。近期InfoQ研究中心发布的《2023大语言模型综合能力测评报告》显示,文心一言的综合评分已与ChatGPT所差无几。
“通义千问”是阿里云推出的大语言模型,它基于“通义”大模型技术研发,能够响应人类以自然语言方式提出的各类指令。千问的各项功能和体验仍在不断完善中,目前已具备的能力包括但不限于:回答问题、创作文字、编写代码、提供各类语言的翻译服务、进行文本润色、文本摘要、扮演角色进行对话等。此前,千问开放了企业邀测,近20万企业用户申请测试,目前阿里云正与大批头部企业联合打造专属大模型。
除了通义千问,阿里云智能正在发布更多通义系列的其他预训练大模型,包括聚焦音视频内容的AI新品“通义听悟”等。据悉,“通义听悟”接入了通义千问大模型的理解与摘要能力,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,是一款工作学习AI助手。
评价
阿里的大模型符合他们一贯To的思路,从目前来看阿里的目标不仅仅是自己做大模型,更是将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括智能算力和开发工具,并在资金和商业化探索方面提供充分支持。
腾讯云行业大模型
腾讯云本次重点呈现腾讯云行业大模型解决方案。腾讯云从产业客户需求场景出发,基于大模型高性能计算集群,依托腾讯云TI平台打造模型精选商店,为客户提供MaaS一站式服务和“量体裁衣、普惠适用”的行业模型解决方案,全面降低落地门槛,助力客户构建专属大模型及智能应用。
目前,腾讯云已为文旅、政务、金融等10余个行业提供了50多个大模型行业解决方案。
评价
腾讯此次也暂时没有选择消费赛道,而是从MaaS一站式解决方案切入。人工智能发展的根本目标是落地于产业,服务于人。能真正解决用户需求、距离场景和数据更近的企业,将拥有大模型的未来。
商汤科技:“日日新SenseNova”大模型
最新升级的“商量SenseChat2.0”在知识信息准确性、逻辑判断能力、上下文理解能力、创作性等方面均有大幅提升,是目前表现最好的中国语言大模型之一。据悉,在全球三个权威大语言模型评测基准测评结果中,商汤“商量SenseChat 2.0”在三个测试集MMLU、AGIEval、C-Eval中的表现均领先ChatGPT。
目前,商汤“商量SenseChat2.0”已在医疗、金融、移动终端、代码开发等领域为客户提供服务,并持续实现快速迭代和提升,以及知识的实时更新。
此外,商汤科技还带来了基于“商汤日日新SenseNova”大模型体系推出的“商汤如影SenseAvatar”AI数字人视频生成平台。该平台基于AI数字人视频生成算法、语言大模型、AI文生图、AIGC等多种能力,能够轻松实现高质量、高效率的数字人视频内容创作。
评价
商汤科技在视觉计算上的优势依然明显,因此在多模态的拓展上有明显优势,此次展出的产品可以看出商汤在大模型领域几乎“全栈式”的布局思路。
星环科技:金融大模型“无涯”
此次展出的星环无涯Transwarp Infinity支持股票、债券、基金、商品等市场事件的全面复盘、总结及演绎推理,以及政策研报的深度分析,为基金经理提供决策辅助。星环求索则可以让非专业用户在无需掌握数据库编程语言的前提下,能够通过自然语言进行自由的数据查询、分析和展示。
评价
星环没有选择大而泛之的大模型路线,而是从比较专业的金融赛道切入,从产品体验上来看,星环打算聚焦细分赛道底层搭建,强调“授人以渔”,让金融、能源、交通等行业都拥有建设自己大模型的能力。
蜜度:3款垂直领域大模型
蜜巢知识问答与内容生成大语言模型是首个软硬件一体国产化知识问答与内容生成大语言模型,专注于政府与企业内部定制化内容生成的场景,模型能够实时基于用户所输入的文档进行知识增强,并对文档中的相关知识进行定制化的知识问答与内容生成,真正实现“千文千面,千人千面”式内容生成,打造属于每个人自己的知识问答与内容生成大模型。此外,蜜巢智能舆情分析大语言模型专注于舆情报告自动撰写。蜜度文修以大语言模型(LLM)为技术底座,通过运用高质量数据学习多种特色子任务,大幅度提升中文校对和润色能力的智能化程度。
评价
作为细分赛道的产品,整体交互体验符合预期,同时为解决企业端政务端用户具体需求,相关产品定位明确。
达观数据:“曹植”大模型
达观基于多年垂直行业数据和场景的积累,在长文本的处理方面深耕多年,研发的“曹植”大模型特别擅长长文档的写作、审核、润色、翻译等。“曹植”可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,未来还将实现多模态内容生成,如长文档中的表格、图表、图片等。
评价
不做大模型时代的“电灯泡”,要做更适合场景应用的洗衣机、电冰箱。
容联云:“赤兔”大模型
“赤兔”是容联云面向企业应用的垂直行业多层次大语言模型,基于“赤兔大模型”,企业可以搭建自己的智能客服和数智化营销,完成从“降本增效”到“价值创造”的进化。赤兔大模型聚焦懂交流、会分析、有知识、能执行“四大能力”。
依托赤兔大模型,企业客服可以实现多维度、细粒度的对话分析理解与内容生产,通过意见挖掘、情感分析、立场检测等洞察用户需求,同时,赤兔大模型还针对多种场景的人机交互应用,自动生成业务话术及流程方案、问答知识库,提升AI运营效率、客服效能及销售转化。其次,丰富的内部知识储备,和灵活的外部知识运用,可以解决大模型在真实性、即时性、逻辑性、可控性等方面的问题。
公司还同时发布了“生成式智能营销服一体化工作空间——机器猫”和“生成式一体化智能客服平台”,旨在推动企业营销和服务数智化转型。
评价
大语言模型“赤兔”,懂交流、会分析、有知识、能执行。
此次大会上,由网易有道自研的国内首个教育大模型“子曰”最新应用成果——虚拟人口语教练首次亮相。除了口语训练外,据悉“子曰”大模型系列应用成果还包括中文作文指导与批改、英语习题精讲等多种教育领域细分应用。此外,有道词典笔、有道听力宝、有道AI学习机等多款智能学习硬件,以及有道翻译等热门产品也在展会亮相。
“子曰”大模型能够作为基座模型支持很多下游任务,为所有下游场景模型提供语义理解、知识表达等基础能力,是有道AI产品体系的核心。有道研发团队在子曰大模型的基础上,会为不同场景设计定制化模型,以实现模型与场景的高度契合。
评价
相较于传统口语训练产品,网易有道AI更像真人教练,不仅口音纯正,其虚拟主播的面部表情,一颦一簇之间也颇为灵动。
科大讯飞(002230):“星火”认知大模型
此外,多款搭载星火认知大模型的最新行业应用成果在科大讯飞展台走进观众视野。在科大讯飞AI学习机、听见智慧屏、智能办公本等产品前,不少观众排队体验。除了可以体验到星火大模型的核心能力,用户还可以了解星火大模型在教育、医疗、办公、数字员工、汽车、金融、工业等多场景的应用成果。
在办公场景,搭载大模型的会议室智能终端——讯飞听见智慧屏畅享版首次展出。它可以实现动态会议记录、会议内容自动整理输出,一键生成多种类型的会议文案,助力用户高效办公。此外,观众还可以体验讯飞听见写作,它可以在自动将音视频文件转化为文字的同时,对内容进行深度分析,实现品宣文案、会议纪要等文本的快速输出。
评价
此次大会上,科大讯飞为大会打造的数字人新闻官亮相展区服务台。从现场互动来看,观众可以与它更自然地实时交互,对于大会的动态和热点,数字人反应也较为流畅。