发布时间:2026.06.19|适配版本:Ollama 0.70+ 最新稳定版
作为当下最火的本地大模型部署工具,Ollama依托极简命令、自动量化、一键部署优势,聚合了全球近百个开源大模型,覆盖通用对话、深度推理、代码开发、图文多模态、向量嵌入、垂直行业六大场景。很多新手入坑最大痛点:模型太多分不清、不知道电脑能跑哪个、场景匹配出错。
本文整理Ollama官方Library全站主流模型,按使用场景大类划分,标注参数体量、显存内存门槛、核心优势、一键下载指令、适配人群,同时附上极简选型公式,看完不用挨个试模型。
前置常识:Ollama模型后缀科普
1、参数:1B=10亿参数,体量越小、配置要求越低;
2、量化:默认Q4_K_M均衡版(速度+精度最优),Q2_K极致低配、Q6_K高精度、FP16无损原版;
3、后缀标识:vision多模态看图、thinking深度推理、coder代码专用、embed向量嵌入、moe混合专家架构。
一、通用对话旗舰模型(日常聊天、文案创作、通识问答,使用率最高)
主打中英文均衡、指令跟随强、兼容性高,个人本地日常使用首选,生态最全、bug最少。
1. Meta Llama全系(Ollama生态顶流)
开发者:Meta|优势:逻辑稳定、工具调用完善、长文本能力强,英文天花板,中文迭代逐年优化
- Llama3.2:极致轻量|规格1B/3B|内存门槛:4GB/6GB|低配笔记本、手机端首选,待机对话、短句问答,指令:
ollama run llama3.2 - Llama3.1:全民均衡款|规格8B/70B/405B|8B入门全能、70B专业文案、405B旗舰推理|支持128K超长上下文,企业级长文档处理,指令:
ollama run llama3.1 - Llama3.3:迭代增强版|70B专属|优化中文理解、结构化输出,适合自媒体文案、办公写作,指令:
ollama run llama3.3 - Llama4:最新旗舰|多模态原生|高配工作站专属,图文+文本全能,指令:
ollama run llama4 - Llama3.2-vision:轻量看图|11B/90B|识图、截图解读、试卷分析,办公识图刚需,指令:
ollama run llama3.2-vision
2. 阿里通义Qwen全系(中文全网最强,无脑首选中文模型)
开发者:阿里云|核心亮点:原生中文优化、无翻译损耗、多国语言优秀、开源免费、版本迭代极快
- Qwen2.5:爆款通用款|0.5B/1.5B/3B/7B/14B/32B/72B|全尺寸覆盖,128K上下文,学生、办公通用,中文吊打同体量Llama,指令:
ollama run qwen2.5 - Qwen3:新一代旗舰|0.6B-235B MoE混合架构|自带推理能力,数学、逻辑大幅升级,适合深度思考,指令:
ollama run qwen3 - Qwen3.5:全能多模态|图文音频一体化|日常看图、写文案、推理三合一,单GPU可跑,指令:
ollama run qwen3.5 - Qwen3-Next:高效精简旗舰|80B|低延迟、高产出,本地部署性价比旗舰,指令:
ollama run qwen3-next
3. Google Gemma全系(轻量化高精度,新手友好)
开发者:谷歌DeepMind|特点:合规开源、稳定性极强、推理干净,适合教学、亲子、办公合规场景
- Gemma2:2B/9B/27B|均衡办公,低噪回应,文案润色首选
- Gemma3:自带视觉,单卡最优模型|识图+对话双能力
- Gemma4:前沿性能,支持音频+图像+文本多模态,全能旗舰
- Gemma3n:移动端专属,平板/轻薄本零压力运行
4. 其他热门通用模型
- Mistral 0.3:7B老牌精品|速度极快、延迟极低,老牌本地模型标杆
- Phi3/Phi4:微软轻量王者|Phi3 3.8B轻薄本封神,Phi4 14B推理对标70B大模型
- Dolphin3:无过滤自由对话|基于Llama微调,开放性高,创作自由度拉满
二、深度推理专属模型(数学解题、逻辑推演、科研论证、解题复盘)
专属思维链推理,擅长奥数、数理推导、方案复盘、逻辑纠错,自带思考输出环节,算力消耗高于通用模型。
- DeepSeek-R1:推理天花板|1.5B/7B/8B/14B/70B/671B|性能对标Gemini2.5、OpenAI o3,全网最强开源推理模型,数学、代码逻辑无敌,指令:
ollama run deepseek-r1 - Phi4-reasoning:小体量推理之王|14B|低配电脑可跑,推理精度越级,学生刷题首选
- Mathstral:Mistral数学专用7B|理工科计算、公式推导、建模计算专属
- Openthinker:开源蒸馏推理模型|轻量化复刻DeepSeek-R1能力,低配平替款
- Cogito:混合推理模型|同尺寸碾压Llama/Qwen,专业科研逻辑推演优选
三、代码开发专用模型(写代码、排错、架构设计、脚本生成)
训练海量开源代码库,适配Python/Java/前端/运维脚本,支持项目级开发、bug修复、注释编写。
- Qwen2.5-Coder / Qwen3-Coder:本地编码第一梯队|0.5B-32B全尺寸,适配全编程语言,Agent自动化开发适配度最高
- DeepSeek-Coder:老牌代码王者|长项目代码读写、跨文件排错、架构设计能力极强
- CodeLlama:Meta官方代码模型|适配Llama生态,本地IDE联动兼容性最好
- Magicoder:小众精品7B|开源项目仿写、轻量化脚本极速生成
- Kimi-K2.7-Code:长时序编码MoE模型|大型项目迭代、长期开发Agent专属
- Athene-V2 72B:日志提取+代码补全双专精|运维开发、日志分析刚需
四、多模态图文模型(识图、解读截图、识别图表、分析照片、OCR)
输入图片即可解读内容,适配办公截图、试卷、流程图、产品图、手写文字识别,分为轻量看图、专业识图两类。
- LLaVA 1.6:老牌万能识图|7B/13B/34B|全网适配最稳,截图解读、OCR通用首选
- Qwen3-VL:通义旗舰识图|图文细节解析、专业图表解读精度极高
- Moondream2 1.4B:极致低配看图|仅829MB显存,轻薄本零门槛识图
- MiniCPM-V4.6:移动端口袋多模态|手机/平板本地看图,功耗极低
- Nemotron3:音视频图文四合一|企业级视频解读、音频转写、图文分析一体化
五、向量嵌入模型(知识库RAG、本地检索、文档相似度匹配)
不生成对话文本,专门把文字转为向量,搭建私有本地知识库、文档检索、语义匹配必备,轻量化、速度快。
- nomic-embed-text / nomic-embed-text-v2-moe:多语言嵌入天花板,长文档检索最优
- mxbai-embed-large:高精度英文嵌入,外文知识库首选
- bge-m3:BAAI国产嵌入,中英文双语均衡,国内RAG项目标配
- qwen3-embedding:通义专属嵌入,适配全系Qwen大模型,联动效果最优
六、垂直行业定制模型(细分领域专用,精准度远超通用模型)
- 医疗行业:MedLlama2、MedGemma1.5|问诊、病历解读、医学常识科普
- 企业办公:Granite4、Granite3-MoE|企业工单、流程问答、工具调用适配企业系统
- 翻译专用:TranslateGemma|支持55国语言离线互译,离线翻译刚需
- 信息抽取:nuextract 3.8B|合同、票据、文本关键字自动提取
- 开源合规:OLMo2|完全开源无商用限制,企业商用零版权风险
七、Ollama极简硬件选型对照表(2026最新)
| 设备配置 | 适配模型档位 | 首选推荐模型 |
|---|---|---|
| 轻薄本8G内存、无独显 | 1B-4B超轻量 | llama3.2:1b、tinyllama、moondream2 |
| 笔记本16G内存、入门独显 | 7B-8B主流档 | qwen2.5:7b、deepseek-r1:8b、llava:7b |
| 台式32G内存、中端独显 | 14B-32B进阶档 | qwen3:14b、phi4、gemma3:12b |
| 64G+内存、高端独立显卡 | 70B+旗舰档 | llama3.3:70b、qwen2.5:72b、deepseek-v3 |
八、新手必用Ollama高频指令
# 一键下载运行模型
ollama run 模型名
# 仅下载不运行
ollama pull 模型名
# 查看本地所有模型
ollama list
# 删除闲置模型释放空间
ollama rm 模型名
# 查看模型详情参数
ollama show 模型名
九、懒人一键选型公式(直接照选不踩坑)
- 中文日常聊天:无脑选 qwen2.5:7b
- 轻薄本低配使用:llama3.2:3b
- 数学做题逻辑推理:deepseek-r1:8b
- 写代码开发:qwen2.5-coder:7b
- 截图看图识图:llava:7b
- 搭建本地知识库:bge-m3 + qwen组合
十、文末总结
截至2026年6月,Ollama官方库常驻模型超300款,淘汰老旧模型后,日常使用仅需掌握以上六大类主流模型即可。现阶段选型核心:中小体量优先Qwen全系、英文生态选Llama、推理选DeepSeek-R1、低配选Phi/Llama3.2,不用盲目下载70B以上大模型,7B量化模型足以满足90%个人本地使用场景。
后续我会持续更新模型迭代动态,整理模型优化参数、自定义Modelfile配置教程,玩转本地私有化AI。