NQLSG and its friends
Collection
From Cyberparrot to playing the role of field application engineer
•
7 items
•
Updated
本模型是使用mergekit(模型合并工具包)融合多个预训练语言模型而成的集成模型,其预期用途为在龙芯3A6000系统上进行部署,且无需依赖独立显卡。在该系统配置下,模型输出速度虽较为缓慢,但仍处于可接受范围,能满足日常对话等场景需求。
该模型采用Model Stock(模型库存)合并方法,以Lunzima/MilkyLoong-Qwen2.5-1.5B-pass5为基础模型进行融合。
以下模型被包含在此次合并中:
生成该模型使用的YAML配置如下:
models:
- model: bond005/meno-tiny-0.1
- model: fblgit/miniclaus-qw1.5B-UNAMGS-GRPO
- model: Sakalti/Saba1.5-1.5B
- model: Lunzima/MilkyLoong-Qwen2.5-1.5B-pass1
- model: Lunzima/MilkyLoong-Qwen2.5-1.5B-pass2
- model: Lunzima/MilkyLoong-Qwen2.5-1.5B-pass3
- model: Lunzima/MilkyLoong-Qwen2.5-1.5B-pass4
- model: Lunzima/MilkyLoong-Qwen2.5-1.5B-pass5
merge_method: model_stock
base_model: Lunzima/MilkyLoong-Qwen2.5-1.5B-pass5
dtype: bfloat16
parameters:
int8_mask: true
该合并模型适用于日常对话场景,尤其在低资源环境下,例如仅配备龙芯3A6000系统且无独立显卡的设备中,表现出较高的性价比。虽然在模型输出速度上无法与配备高性能独立显卡的系统相比,但在可接受的缓慢速度下,依然能够为用户提供较为稳定的对话交互体验,满足诸如简单咨询、闲聊等日常使用需求。