课程精讲｜智能语言服务产业学院“2025 AI Agent班”第十八周课程回顾-高级翻译学院网站

4月26日，智能语言服务产业学院“2025 AI Agent”项目班顺利开展第十八周课程。本次课程由天津外国语大学网络安全和信息化办公室副主任、高级工程师韩嘉彬主讲，主题为《大语言模型本地部署和微调》。

课程首先聚焦平台开发与硬件环境。韩嘉彬对比了个人GPU配置与云端算力租赁的差异，梳理了不同显存规模对模型部署的影响，并介绍了Huggingface、魔搭社区等主流模型生态平台。在本地化部署环节，他分析了Ollama、vLLM、SGLang等推理框架的特性与适用场景，演示了通过vLLM搭建API服务实现模型在线推理的方法。在微调技术部分，韩嘉彬辨析了全量微调、局部微调与增量微调的概念边界，对比了提示词工程与模型微调的适用场景，重点讲解了LoRA高效微调技术的原理与优势。

实操训练环节，韩嘉彬带领学员使用Ollama工具完成本地大模型的完整部署流程，包括软件安装、安全与存储配置、模型下载、命令行调用及API服务启动。学员将本地模型集成至Cherry Studio等第三方工具，现场完成对话测试，实现了从环境搭建到应用集成的闭环操作。

随后，韩嘉彬带领学员走进学校数据中心机房，结合实体设备讲解高算力架构与底层网络通信布局。学员对照现场运行的硬件环境，就模型部署中的资源配置与性能优化问题进行提问。韩嘉彬结合设备运行状态逐一回应，将理论知识与实体设施进行对照讲解。

通过本次课程，学员掌握了大模型本地部署的运行机制与操作路径，能够独立完成从模型下载、环境配置到第三方工具集成的全流程操作。同时建立了对全量微调、局部微调、增量微调及LoRA技术的系统认知，为后续深入学习大模型微调奠定了基础。

智能语言服务产业学院将持续推进系列课程建设，强化前沿模型应用与工程化实践训练，为培养复合型语言服务人才提供支撑。

通讯员：田月茹