我们擅长商业策略与用户体验的完美结合。
欢迎浏览我们的案例。
10 月,可以说是国内大模型领域的一场小考,好不热闹——从腾讯、讯飞、智谱、百川,各家大模型厂商纷纷拿出通用大模型的新版本,试图一较高下。
本月最后一天,阿里云云栖大会如期开幕,阿里云旗下的通义千问,交上本月的最后一份答卷。
继 4 月正式发布通义千问大模型后,阿里云发布了通义千问 2.0 版本——与 4 月相比,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有在性能上取得较大提升。
开放则是本届云栖的核心主题。“过去十来年,阿里云服务了中国移动互联网的大发展。今天,随着大模型技术的迅速发展,智能化时代正在开启,阿里云要打造 AI 时代一朵最开放的云。”主论坛演讲中,阿里巴巴集团董事会主席蔡崇信如此表示。
阿里云也亮出了通义千问和其他模型的比较结果。在 MMLU、C-Eval、GSM8K、HumanEval、MATH 等 10 个主流 Benchmark 测评集上,通义千问 2.0 的得分整体超越 Meta 的 Llama-2-70B。相比 OpenAI 的 Chat-3.5,是九胜一负;相比 GPT-4 则是四胜六负,与 GPT-4 的差距进一步缩小。
来源:阿里云/侵删
不过,和竞品拼测评分数,只能说是大模型比拼的基础。本届云栖的重点更多放在产品化、各类能力开放上。比如,通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。并且,通义千问 2.0 在指令遵循、工具使用、精细化创作等方面作了技术优化,这些能力更好地被下游应用场景集成。
来源:阿里云/侵删
发布会的重点,显然放在了通义系列的“模型团”上。CTO 周靖人花费了大量时间介绍通义模型家族里的八大行业模型,包括:
通义灵码-智能编码助手
通义智文-AI 阅读助手
通义听悟-工作学习 AI 助手
通义星尘-个性化角色创作平台
通义点金-智能投研助手
通义晓蜜-智能客服
通义仁心-个人专属健康助手
通义法睿-AI 法律顾问
并且,通义千问还正式发布了 APP,在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。另外,开发者可以通过网页嵌入、API/SDK 调用等方式,将上述的模型能力集成到自己的大模型应用和服务中。
国内大模型领域已经从通用大模型层,逐渐转向应用层。要扩大开放,也是为了吸引更多的开发者和客户。因此,理清边界很重要。
尽管阿里云这次发布了八大产品模型,但周靖人强调,阿里云此举并非为了直接 To C 提供服务,而是 To B。做行业模型,更多是像个面向客户的 Demo,让客户先了解到大模型能做什么。
截至 10 月,阿里云已与 60 多个行业头部伙伴进行深度合作,通义千问已经在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
“要做开放的云,我们说到做到。如果有的开发者,有能力做自己的底层通用模型,我们也会提供应用模型的接口和开发平台,让开发者来做应用开发。”周靖人对 36 氪表示。
在早上的主论坛上,童语故事创始人兼 CEO 张华,就向开发者分享了一位父亲用大模型创业的故事。7 个人的团队,在阿里云上创业,不到三个月,“童语故事”的 MAU(月活用户)就到了几十万,平均每个月 IT 成本才 1 万元左右。“有了大模型、云计算这些成熟的技术,才能让我们实现低成本高效创业。”张华说。
从产品到生态,阿里云已经付出不少切实的努力。去年的云栖大会上,阿里云发布了 AI 开源社区“魔搭”。一年后,魔搭现在已有 280 万开发者、2300 多个优质模型,模型下载量超过 1 亿。
比起从模型到应用都做,阿里云更希望达到的未来是,让开发者、中小企业借助通义千问的基础模型能力,借助开源社区的各类资源,快速地开发自己的模型。