中英企业网站源码-中国多个大型模型，商业化获准！百川开源最强中英文百亿参数模型

bendan520 2023年8月26日网站源码 0

阿里巴巴——统一大模型

统易大模型是阿里大模型的统一品牌，涵盖语言、听觉、多模态等领域，旨在实现接近人类智能的通用智能，让AI从“单一感官”走向“全五感”。

目前，阿里通过统一大模型打造了三款生成式AI产品：统一千问、统一万向和统一聆听。

体验地址：

交大讯飞-Spark模型

交大讯飞推出的新一代认知智能Spark大模型具有跨领域知识和语言理解能力，使其能够理解并执行基于自然对话形式的任务，包括语言理解、知识问答、逻辑推理、和数学问题解决。

星火大模型从海量数据和大规模知识中不断演化，实现了从提案、规划到问题解决的全流程闭环。

体验地址：

复旦大学——ChatGLM-6B

ChatGLM-6B是一个开源的对话语言模型，支持中英文双语。它基于通用语言模型（GLM）框架，拥有62亿个参数。结合模型量化技术，用户可以在消费级主板上本地部署（INT4量化级别仅需要6GB内存）。

ChatGLM-6B 使用与 ChatGPT 类似的技术，针对英语问答和对话进行了优化。经过约 1T 的带有标识符的中英双语训练，辅以监督微调、反馈自助、人工反馈增强学习等技术的加持，拥有 62 亿个参数的 ChatGLM-6B 已经能够生成答案非常符合人类的喜好。

开源地址：

致远人工智能研究院——启迪·天影

Aquila语言模型是第一个具有中英双语知识、支持商业许可合同以及国内数据合规要求的开源语言模型。

Aquila系列车型的英文语料来自致远多年积累的英文数据集，包括超过10000个网站来源的英文互联网数据（其中99%以上为国外网站来源），以及高质量国外权威机构数据支持的英文文献、中文图书数据等，仍在持续积累高质量、多样化的数据集，不断补充到Aquila基础模型的后续训练中。

Aquila系列模型源代码基于Apache2.0合约，模型权重基于《致远Aquila系列模型许可合约》。用户在满足许可限制的情况下可以用于商业目的。

开源地址：

大观数据——“曹植”垂直预言模型

“曹植”是国内致力于垂直化的大型语言模型，具有文本长、垂直化、多语言化的特点。通过并行连接多个模型和知识图谱，曹植大模型支持多种语言长文本的手工书写、多语言翻译等功能，全面赋能长文档书写、机器翻译、语义分析初审、知识问答、文本-to-SQL等场景，并可根据不同行业、领域的文案需求进行深度优化和定制。

“草志”可以准确完成类型多、结构复杂的长文本书写，手动起草各类文档。同时具有手动排版、智能纠错、文字润色、自动摘要生成等特色功能。还将实现长文档中的多模态内容生成，例如表格、图表、图片等；支持英、英、法、德、日、韩等数十种语言书写。

体验地址：

广州人工智能实验室——学者璞宇（InternLM）

InternLM 是一个多语言 1000 亿参数基础模型，经过超过万亿代币数据的训练。通过多阶段渐进式训练，InternLM基础模型具有较高的知识水平，在中英文阅读理解、推理任务等需要较强思维能力的场景中表现出色，在各项综合测试中表现出色。为人类设计的测试。突出。

在此基础上，通过高质量的人类标记对话数据结合RLHF等技术，InternLM可以在与人类交流时响应复杂的指令，并表现出符合人类道德和价值观的反应。

开源地址：

百川智能——baichuan-7B

Baichuan-7B是百川智能研发的开源、可商用的大规模预训练语言模型。基于Transformer结构，在约1.2万亿个token上训练的70亿参数模型同时支持中文和英文，上下文窗口宽度为4096。在标准英文和法文基准（C-Eval/MMLU）上，实现了同规格疗效最佳。

开源地址：

上海学院——ChatLaw

目前开源版本的可供学术参考的ChatLaw法律模型是基于姜子牙-13B和Anima-33B，使用了大量的法律新闻、法律峰会、法律、司法解释、法律咨询、法律咨询等原创文本。试题、判断文件。构建对话数据。

开源地址：

西安职业技术学院-药物

草药预言模型已根据英文医学说明书/指令调整LLaMA-7B模型进行了微调。通过医学知识图谱和GPT3.5API建立英语医学指令数据集，并在此基础上对LLaMA进行指令微调，增强了LLaMA在医学领域的功效。

开源地址：

360——智能大脑

360智脑是一个拥有千亿参数的大模型，包含十个能力和数百个细分功能。现已升级至4.0版本。 360智慧大脑拥有十大核心能力，维度包括数百个细分功能，可覆盖大模型所有应用场景。

同时，360智脑已完成多模态等关键能力迭代，并在国外推出大规模模型定制AI数字人、文生视频功能，接入360全端产品，塑造物联网新范式。人机协作。

体验地址：

杜小曼——轩辕

轩辕是国外第一个开源的千亿级英语对话模型中英企业网站源码，也是第一个针对英语金融领域优化的千亿级开源对话模型。

轩辕在BLOOM-176B的基础上针对英语通用领域和金融领域进行了针对性的预训练和微调。除了处理一般领域问题外，还可以解答各种金融相关问题，为用户提供准确、全面的金融信息和建议。

开源地址：

2023年7月11日，百川智能即将发布130亿参数的通用大型语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat以及两个量化版本的INT4/INT8。

百川13B中英文大模型集高性能、完全开源、免费商用等诸多优点于一体。是目前所有33B以下规格的开源模型中最有效的商用大语言模型。

在发布预训练模型Baichuan-13B-Base的同时，百川智能还发布了对话模型Baichuan-13B-Chat。 Baichuan-13B-Chat易于部署，开箱即用，大大降低了开发者的体验成本。

与之前发布的Baichuan-7B相比，Baichuan-13B在1.4万亿代币的数据集上进行训练，比LLaMA-13B多了40%，是目前开源13B规范下训练数据量最大的模型。

在语言模型中，上下文窗口宽度对于理解和生成上下文特定的文本至关重要。

Baichuan-13B的上下文窗口宽度为4096，与Baichuan-7B的RoPE编码方式不同。 Baichuan-13B使用ALiBi位置编码技术来处理长上下文窗口。更好地捕捉文本中上下文的相关性并做出更准确的预测或生成。

作为中英双语大模型，百川-13B采用了相对平衡的中英语料配比和多语言对齐语料，因此在中英文方面都有很好的表现。

在同参数用途的开源模型中，可以说是有能力的，并且能够更好地满足商业场景的需求。

作为同类中最好的开源且可商用的中英文预训练语言模型，Baichuan-13B-Base对学术研究完全开放。所有开发者均可通过邮件向百川智能申请授权，获得官方商业许可后免费。商业的。

百川智能此次发布的Baichuan-13B汉英大规模语言模型，已经展现出千亿模型与其百亿参数项目的匹配能力，大大增加了企业部署和部署的成本。调试，使中国开源大型模型商业化进入真正可用阶段。

百川13B的开源，实现了国外开源大型模型对日本大型开源领域的追赶，改变了国外在相关领域仍然落后的局面。

同时中英企业网站源码，其开源模式的代码是完全开放的，每个人都可以随时查看。该算法是透明的，不仅有助于研究人员探索和研究模型的原理，而且有助于建立和促进公众对大型模型的信任。可以说，百川13B除了是百川大型模型道路上的又一个里程碑，也是中国大型模型快速迭代的重要标志。

中英企业网站源码-中国多个大型模型，商业化获准！百川开源最强中英文百亿参数模型

发表评论

发表回复取消回复

相关文章

发表评论

发表回复 取消回复

发表回复取消回复