北京白癜风治疗医院哪家最好 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/bdf/作者|星奈
编辑|方奇
媒体|AI大模型工场
国内大模型发展趋势
11月份解读小模型异军突起
如今,国内大模型厂商在模型参数上越来越卷,动辄百亿、千亿甚至万亿的模型层出不穷。与此同时,小模型也在悄悄爆发。
近期,微软推出Phi-2的小型语言模型,据了解,该模型参数仅有27亿,但在BigBenchHard(BBH)、常识推理、语言理解、数学和编码基准测试中,其平均性能得分已经超过70亿、10亿参数规模的Mistral和Llama2。Phi-2也因参数规模足够小,可以在笔记本电脑、手机等移动设备上运行。
谷歌也在积极拥抱小模型,今年5月开发者大会上发布的新一代大语言模型PaLM2,共四个尺寸,其中最小尺寸模型“壁虎”可以在手上运行。最近谷歌新杀手锏——多模态大模型“Gemini”发布并同步上线Nano版本,同样侧重端侧。
在国内,阿里云最近开源模型Qwen-1.8B,成为尺寸最小的中国开源大模型,推理2K长度文本内容仅需G显存,可在消费级终端部署。
小模型异军突起的背后是大模型进入“平台期”后的困境。相比大模型,小模型在参数量上不及大模型,但它们仍然能够实现一系列的智能任务,比如图像分类、语音识别、文本生成等。并且小模型只需要较少的计算资源和内存,就可以在资源受限的环境中部署和运行。对企业来说,在大模型高昂的训练和推理成本面前,小模型无疑能“花小钱办大事”,是他们最好的选择。
HuggingFace首席执行官ClemDelangue预测:“大多数公司都会意识到,更小、更便宜、更专业的模型对99%的人工智能用例更有意义。”
Agents是大模型的未来?
大模型争夺战的下半场已拉开序幕,而AIAgent(智能体)成为舞台上科技巨头们争抢的焦点。
11月6日,OpenAI开发者大会上,OpenAI推出一系列产品功能用于支持Agents的发展,包括:
GPTbuilder:对话形式构建agent的UI,无需任何代码;
AssistantsAPI:一系列高级API帮助开发者快速搭建应用;
GPTs平台:Agents分发平台。开发者可以上传自己的Agent(OpenAI叫客制化GPT),并获得利润分成。
此前,微软的AutoGen、谷歌Deepmind的RoboticAgent、亚马逊的BedrockAgents以及阿里云推出的魔搭GPT等均已在Agent领域布局。
Agent为什么成为巨头