0 90 2025-05-27 06:30:05
收藏
# 安装核心依赖(PyTorch + Transformers)
pip install torch==2.0.1+cu118 torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install transformers==4.35.0 accelerate sentencepiece
# 安装显存优化库(8-bit/4-bit量化支持)
pip install bitsandbytes # 用于4/8-bit量化
pip install auto-gptq # 可选(GPU推理加速)
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
model_path = "DeepSeek-AI/deepseek-moe-16b-chat" # 替换为本地路径(若已下载)
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
# 关键配置:启用8-bit量化 + 显存卸载 + 共享内存
model = AutoModelForCausalLM.from_pretrained(
model_path,
device_map="auto", # 自动分配CPU/GPU
torch_dtype=torch.float16, # 半精度
load_in_8bit=True, # 8-bit量化(显存需求减半)
offload_folder="offload_cache", # 临时卸载目录
trust_remote_code=True
)
# 如果8-bit仍OOM,改用4-bit(需bitsandbytes>=0.41.0)
model = AutoModelForCausalLM.from_pretrained(
model_path,
load_in_4bit=True, # 4-bit量化
bnb_4bit_compute_dtype=torch.float16,
device_map="auto"
)
from transformers import TextStreamer
def chat(query: str, max_new_tokens=512):
inputs = tokenizer(query, return_tensors="pt").to("cuda")
streamer = TextStreamer(tokenizer, skip_prompt=True) # 流式输出
output = model.generate(
**inputs,
max_new_tokens=max_new_tokens,
do_sample=True,
temperature=0.7,
streamer=streamer
)
return tokenizer.decode(output[0], skip_special_tokens=True)
# 测试
chat("如何用Python快速训练一个MoE模型?")
本文地址:https://xzo.com.cn/develop/python/1291.html
如果您认可我们的分享,有意与我们合作开展帝国cms网站建设与开发业务或插件定制,请联系右侧在线客服。我们能给您的,就是高质量的模板与售后。
标注了信息来源为下载鸥的文章皆为原创,如果是转载的优质文章,我们也都标注了出处。如果您喜欢我们的文章,请按照下载鸥所标注的文章出处进行标注,谢谢您的配合。
Python免费、开源、简单,且含有海量的库。其功能也十分强大,不仅可以做网站、做爬虫、还可以做大数据、做人脸识别,等等等等。如果是新手入门,我们建议是首选Python。
国内知名度比较高的Python中文分词有哈工大LTP、中科院计算所NLPIR、清华大...
结巴分词支持3种模式:全模式、精确模式和搜索引擎模式,不同的模式效果会有差...
但凡对电脑知识了解多一点的朋友可能就听说过进程,而如果对蜘蛛爬虫有了解,那...
python爬虫爬取百度图片是很多人python爬虫入门后一个重要的练手项目。一方...
爬虫软件很多,支持爬虫功能的语言也很多,而用python做爬虫,辅以包罗万象的pyth...
帝国cms有自带的给关键词添加内链功能,但需要手动添加关键词,容易出现疏漏和...
采集站的必备资源是自动审核,要做到日收录也离不开定时发布。而本插件的自动...
帝国cms 对接纳米数据(www.nami.com)接口,本接口主要接收、整理足球比赛实时数...
帝国CMS自带的搜索功能虽然强大,但也有很强的局限性 -- 必须关键词完全匹配...
百度开放了系列AI功能api如图像上色、图像去雾、图像修复、无损放大、清晰...
本插件适用于内网用户,可查看单篇文章访问者ip地址。如果添加访问者ip组,可查...
许多网站会做一些小功能小插件给客户使用以增强用户黏性,比如图片转文字,这种...
通过本插件,可以实现帝国cms网站对接百度云api实现图像无损放大的功能。经过...