热钱翻涌的 AI 大模型创业,一笔围绕头部 AI 创业公司的关键投资已落下帷幕。
36 氪从多个独立信源处获悉,AI 大模型公司智谱华章(以下简称“智谱”)数月前已完成 B-2 轮融资,金额为数亿人民币,由美团战投独家投资,该轮投后估值为近 5 亿美金。据了解,智谱后续几轮融资也陆续完成。
对于以上融资信息,智谱官方暂未表态。
这也是近期少有的一笔数额破亿美金的融资。此前拿到融资的 AI 创业公司,数额大都在百万、千万美金级别,能够拿出自研模型的几家距离亿元俱乐部仍有一步之遥。
一名投资人告诉 36 氪,能拿到上亿美金的创业公司,需要兼具顶级团队和自研大模型的技术,且有成功的落地经验——而这样的公司,国内目前一只手都数得过来。
在 AI 大模型研究领域,智谱团队在业内始终备受瞩目,其成立于 2019 年、由清华大学知识工程实验室(KEG)技术成果转化而来。
出身清华自然语言实验室,智谱的核心团队阵容可谓豪华:国内首个中英文平衡的跨语言知识图谱系统 XLORE 设计和研发者张鹏担任 CEO,团队研究成员也大都来自清华计算机系。
数据、算力、人才,是大模型创业者必备的入场券。而智源早在 2021 年,就基本集齐了所有要素。
一名内部人士告诉 36 氪,得益于近 20 年前就开始做的开源情报分析项目,团队不仅在 2006 年推出了科技情报大数据挖掘与服务系统平台 AMiner,还为大模型研发积累了较丰富的中英双语数据,以及一线工程经验。而大规模的算力,又是靠租借超算平台、与智源等研究机构合作等“巧劲”解决的。
2022 年 8 月,智谱联合 KEG 共同推出了千亿级中英文预训练语言模型 GLM-130 B。据观察,除却阿里等互联网企业外,智谱是彼时尝试千亿级语言大模型的首家初创企业。
GLM-130 B 的表现也得到了认可。斯坦福大学基础模型研究中心的一项研究表明,GLM-130 B 能在准确性和恶意性指标上与 OpenAI 发布的大模型 GPT-3 175 B 接近或持平。这一奠定智谱业界地位的模型已被全球 41 个国家 266 家机构申请使用。据 36 氪了解,申请使用的机构就包括腾讯、字节跳动等头部互联网公司。
今年 3 月,智谱开源了 62 亿参数的中英双语对话的轻量模型 ChatGLM-6 B,支持用户在单张消费级显卡上进行推理使用。同时,基于 GLM-130 B 基座的语言生成应用 ChatGLM 也同期推出,并开启了内测。
即便仍然存在数学处理、逻辑推理能力较弱等大模型的通病,但 ChatGLM-6 B 却补上了 ChatGPT 至今仍未解决的时效性短板。一名知情人士对 36 氪介绍,源于此前团队在业务合作和研究中积累的技术,ChatGLM-6 B 知道推特现在的 CEO 是 Elon Musk。
有多重资源和技术能力的加持,智谱在一众 AI 新势力中也尤为炙手可热。
2022 年 9 月,智谱完成 1 亿元 B 轮融资,由君联资本和启明创投联合领投。而此轮互联网资本的入局,意味着大模型发展已从研究性的探索,快速进入应用落地阶段。
一名知情人士告诉 36 氪,在美团广告算法的优化上,智谱的算法已经有了较为出色的表现。
美团一直在寻求 AI 与业务的结合机会。早在 2018 年 2 月,美团点评就设立了 Al 平台部 – NLP(自然语言处理)中心,为包括智能客服、场景化找店及搜索在内的各项业务提供文本语义理解服务。前 Facebook(现 Meta)Research Scientist 和微软亚洲研究院主管研究员、现快手技术副总裁王仲远,则是成立 NLP 中心的牵头人。
在 2020 年中的组织架构调整中,美团点评搜索与 NLP 部门被纳入了新成立的 AI 平台,由曾任 Google 高级工程师、百度主任架构师的美团首席科学家夏华夏坐镇。
ChatGPT 爆火以来,互联网企业靠投资创企共建 AI 生态的例子并不少见。比如知乎投资面壁智能,共同研发大模型“知海图 AI”。牵手智谱,美团则是给自己找到了一个技术和业务更为成熟的盟友。