Windows下中文微调Llama3,单卡8G显存只需5分钟,模型可接入GPT4All、Ollama,实现CPU推理聊天,附Colab一键训练脚本。

Windows下中文微调Llama3,单卡8G显存只需5分钟,模型可接入GPT4、Ollama,实现CPU推理聊天,附Colab一键训练脚本。 Llama3模型申请与本地部署    • Llama 3 模型申请与本地部署的几种方法,总有一种适用你。   AI大模型搭建本地知识库    • Video   Llama2微调教程    • 🦙使用自己的数据微调Llama 2 最简单方法 ,Llama 2 “烹饪”食谱,附c...   Llama2申请与本地部署    • Llama2模型申请与本地部署详细教程   colab一键训练 https://colab.research.google.com/dri... unslo本地安装包下载 百度网盘:https://pan.baidu.com/s/17XehOXC2LMbn... 谷歌网盘:https://drive.google.com/drive/folder... 视频里训练的lora:https://drive.google.com/file/d/1REtJ... Windows本地部署条件 1、Windows10/Windows11 2、英伟达卡8G显存、16G内存,安装CUDA12.1、cuDNN8.9,C盘剩余空间20GB、unsloth安装盘S40GB 3、依赖软件:CUDA12.1+cuDNN8.9、Python11.9、Git、Visual Studio 2022、llvm(可选) 4、HuggingFace账号,上传训练数据集 Windows部署步骤 一、下载安装包 1、安装cuda12.1,配置cuDNN8.9 2、安装Visual Studio 2022 3、解压unsloth 4、安装python11 5、安装git 6、设置llvm系统环境变量(可选) 二、安装unsloth 1、使用python11创建虚拟环境 python311\python.exe -m venv venv 2、激活虚拟环境 call venv\script\activate.bat 3、安装依赖包 pip install torch==2.2.2 --index-url https://download.pytorch.org/whl/cu121 pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.... pip install --no-deps trl peft accelerate bitsandbytes pip install deepspeed-0.13.1+unknown-py3-none-any.whl pip install triton-2.1.0-cp311-cp311-win_amd64.whl pip install xformers==0.0.25.post1 4、测试安装是否成功 nvcc --version python -m [xformers.info](http://xformers.info/) python -m bitsandbytes 5、运行脚本 test-unlora.py 测试微调之前推理 fine-tuning.py 用数据集微调 test-lora.py 测试微调之后推理 save-16bit.py 合并保存模型16位 save-gguf-4bit.py 4位量化gguf格式 三、4位量化需要安装llama.cpp,步骤如下: 1、git clone https://github.com/ggerganov/llama.cpp 2、按官方文档编译 mkdir build cd build cmake .. -DLLAMA_CUBLAS=ON 3、设置Visual Studio 2022中cmake路径到系统环境变量path里 C:\Program Files\Microsoft Visual Studio\2022\Professional\Common7\IDE\CommonExtensions\Microsoft\CMake\CMake\bin C:\Program Files\Microsoft Visual Studio\2022\Professional 4、编译llama.cpp cmake --build . --config Release 5、如果上面这句编译命令无法执行,需要做以下操作: 复制这个路径下的 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\extras\visual_studio_integration\MSBuildExtensions 4个文件,粘贴到以下目录里 C:\Program Files (x86)\Microsoft Visual Studio\2022\BuildTools\MSBuild\Microsoft\VC\v170\BuildCustomizations 6、编译好以后,把llama.cpp\build\bing\release目录下的所有文件复制到llama.cpp目录下 7、重新运行fine-tuning.py微调保存为 00:00 介绍 00:44 第一部分colab微调 02:18 训练数据集 03:26 微调设置与训练 06:21 微调后用GPT4All推理 07:21 第二部分本地微调 08:46 本地部署训练程序 13:28 本地微调 14:42 本地量化4位模型

China's Chip Breakthrough Terrifies America and Taiwan
▶︎

China's Chip Breakthrough Terrifies America and Taiwan

Running a 35B AI Model on 6GB VRAM, FAST (llama.cpp Guide)
▶︎

Running a 35B AI Model on 6GB VRAM, FAST (llama.cpp Guide)

都說年紀大學不會語言,這個80歲老人偏不信|Steve Kaufmann:80歲會20種語言,5個方法和你想的完全相反
▶︎

都說年紀大學不會語言,這個80歲老人偏不信|Steve Kaufmann:80歲會20種語言,5個方法和你想的完全相反

Windows 10: Four Months to Go (Again)
▶︎

Windows 10: Four Months to Go (Again)

Optimize Your AI - Quantization Explained
▶︎

Optimize Your AI - Quantization Explained

Rufus JUST DESTROYED Windows 11 As Millions Watch Microsoft COLLAPSE!
▶︎

Rufus JUST DESTROYED Windows 11 As Millions Watch Microsoft COLLAPSE!

Automate with Python – Full Course for Beginners
▶︎

Automate with Python – Full Course for Beginners

Something is jamming GPS over Europe. Here's what we found
▶︎

Something is jamming GPS over Europe. Here's what we found

Every Free App You Actually Need Explained in 20 Minutes
▶︎

Every Free App You Actually Need Explained in 20 Minutes

離線不怕隱私外洩!免費開源 AI 助手 Ollama 從安裝到微調,一支影片通通搞定!
▶︎

離線不怕隱私外洩!免費開源 AI 助手 Ollama 從安裝到微調,一支影片通通搞定!

本地AI哪家强?统一内存大横评!
▶︎

本地AI哪家强?统一内存大横评!

Claude 最强模型被禁!“开源越狱”才是真自由,实测3款热门无审查模型,是时候部署本地AI了 | 零度解说
▶︎

Claude 最强模型被禁!“开源越狱”才是真自由,实测3款热门无审查模型,是时候部署本地AI了 | 零度解说

史诗级崩盘预警!为什么SpaceX急着上市?你的养老金正沦为硅谷大佬的“提款机”!华尔街的终极阳谋,对散户的收割你根本逃不掉! 【艾财说210】
▶︎

史诗级崩盘预警!为什么SpaceX急着上市?你的养老金正沦为硅谷大佬的“提款机”!华尔街的终极阳谋,对散户的收割你根本逃不掉! 【艾财说210】

微軟這波「流氓操作」徹底惹毛全世界,連自家CEO都看不下去了?🔥
▶︎

微軟這波「流氓操作」徹底惹毛全世界,連自家CEO都看不下去了?🔥

一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成,1Panel出品。
▶︎

一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成,1Panel出品。

I Built a Minimalist AI Note Device
▶︎

I Built a Minimalist AI Note Device

15分鐘學會AI Agent|完整講解
▶︎

15分鐘學會AI Agent|完整講解

The Local AI Hardware Mistake Everyone Makes
▶︎

The Local AI Hardware Mistake Everyone Makes

戲耍整個日本神秘罪犯,130萬次警力追兇40餘年,依舊沒能抓住他
▶︎

戲耍整個日本神秘罪犯,130萬次警力追兇40餘年,依舊沒能抓住他

一个视频搞懂 DeepSeek V4!
▶︎

一个视频搞懂 DeepSeek V4!