阿里巴巴发布通义千问7B模型 开源免费可商用 支持8K上下文长度 – 蓝点网
今天阿里巴巴宣布旗下大型语言模型产品通义千问 7B 参数模型已经开源,阿里该模型为完全开源、巴巴免费、发布费可商用。通义这个模型包括两个子模型,千问一个是型开下文通用型的 Qwen-7B 模型,另一个是源免对话模型 Qweb-7B-Chat,两个模型均为开源免费可商用。商用K上 这两个模型目前已经在阿里达摩院的支持魔搭社区和国外知名 AI 模型社区 Hugging Face 上线,有兴趣的长度用户可以下载模型进行测试。 魔搭社区:https://modelscope.cn/models/qwen/Qwen-7B/summary Hugging Face:https://huggingface.co/Qwen/Qwen-7B Github:https://github.com/QwenLM/Qwen-7B 以下是蓝点阿里云对 Qwen-7B 模型的自述: 通义千问 – 7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 是阿里基于 Transformer 的大语言模型,在超大规模的巴巴预训练数据上进行训练得到。预训练数据类型多样,发布费覆盖广泛,通义包括大量网络文本、专业书籍、代码等。同时,在 Qwen-7B 的基础上,我们使用对齐机制打造了基于大语言模型的 AI 助手 Qwen-7B-Chat。Qwen-7B 系列模型的特点包括: 大规模高质量预训练数据:我们使用了超过 2.2 万亿 token 的自建大规模预训练数据集进行语言模型的预训练。数据集包括文本和代码等多种数据类型,覆盖通用领域和专业领域。 优秀的模型性能:相比同规模的开源模型,Qwen-7B 在多个评测数据集上具有显著优势,甚至超出 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。 更好地支持多语言:基于更大词表的分词器在分词上更高效,同时它对其他语言表现更加友好。用户可以在 Qwen-7B 的基础上更方便地训练特定语言的 7B 语言模型。 8K 的上下文长度:Qwen-7B 及 Qwen-7B-Chat 均能支持 8K 的上下文长度,允许用户输入更长的 prompt。 支持插件调用:Qwen-7B-Chat 针对插件调用相关的对齐数据做了特定优化,当前模型能有效调用插件以及升级为 Agent。
- 最近发表
- 随机阅读
-
- 服装时尚软件下载大全(服装软件大全图片)
- 富露哲理的细彩散文励志的人逝世哲理好文2023/9/11哲教小漫笔
- 11月2日鸡冠洞景区防疫告诉布告
- 2021北京海淀区停息文娱场开停业
- 发挥“千亿县”示范带动作用 因地制宜发展县域经济
- Steam讲事游戏衰典活动开启 百余款剧情游戏特卖中
- 有哲理的短语文章800字散文
- 2021武汉菊花展有几个展区 武汉菊花展正在哪个公园
- “赔本赚吆喝”的价格战进入尾声,多地银行调整房贷利率下限
- 富有哲理的典范文章人逝世哲理小漫笔2023/9/3糊心中的哲教做文
- 暗中童话风汇散游戏《猫头鹰战灯塔》6月26日登岸Steam 建制木雕聆听访客故事
- 2021上海十一月花展战活动汇总
- 家具行业的内卷现象 顺德家具网-
- 2021祸州有哪些登山的好往背
- 震惊心灵的xx做文哲教小漫笔2023年9月2日
- 《单人成止》销量冲破一百万 游戏总监收文称开
- 罗体:面对切尔西的挽..
- 2021神龙架国际滑雪场开放时候
- 十大年夜热傲的散文励志的典范文章2023年9月7日哲教必读十大年夜典范
- 昆明乌龙潭公园有哪些好玩的
- 搜索
-
- 友情链接
-