极限挑战：RK3588 NPU 跑LLM

在4GB 板载LPDDR4内存的底配版 RK3588 开发板上，首先借助RKLLM 工具链量化编译 11 亿参数的 TinyLlama，并最终在开发板端侧运行。这期视频是玩转RK3588 NPU 系列的第四集，也是目前这个系列的最后一期。整个视频包含4个关键部分资源获取：获取RKLLM与TinyLlama-1.1B 量化与编译：PC端编译环境配置、皆准模型转换脚本进行LLM量化与编译、编译运行LLM的示例推理程序板端配置：创建Swap分区与固定板端硬件频率端侧推理：在开发板端运行量化后的LLM并监测系统资源使用情况 rknn-toolkit2资源链接: https://github.com/airockchip/rknn-to... 大模型资源链接： https://huggingface.co/TinyLlama/Tiny... https://www.modelscope.cn/models/AI-M... 视频中涉及到的脚本、测试程序链接： https://github.com/hannahrepo/rk3588-npu #RK3588 #NPU #ZeroCopy #MultiCore #EdgeAI #YOLOv5 #EmbeddedLinux #Rockchip #MachineLearning #PerformanceOptimization

6 TOPS 到底是生产力还是噱头？深度拆解RK3588 NPU架构

6 TOPS 到底是生产力还是噱头？深度拆解RK3588 NPU架构

国产SoC能不能打？瑞芯微、华为海思、全志、飞腾、龙芯的现状与选型建议

国产SoC能不能打？瑞芯微、华为海思、全志、飞腾、龙芯的现状与选型建议

假如你从今天开始学习Agent Skills，需要多久才能学会？

假如你从今天开始学习Agent Skills，需要多久才能学会？

【Loop Engineering 循环工程】从理论到实践，它真的适合每个人吗？

【Loop Engineering 循环工程】从理论到实践，它真的适合每个人吗？

Running a 35B AI Model on 6GB VRAM, FAST (llama.cpp Guide)

Running a 35B AI Model on 6GB VRAM, FAST (llama.cpp Guide)

CC Switch 实战：让 Claude Code 自动切换 API，OpenRouter 免费模型也能稳定跑

CC Switch 实战：让 Claude Code 自动切换 API，OpenRouter 免费模型也能稳定跑

本地AI哪家强？统一内存大横评！

本地AI哪家强？统一内存大横评！

Gemma 4 还是 Qwen？本地跑模型，我直接告诉你选谁

Gemma 4 还是 Qwen？本地跑模型，我直接告诉你选谁

300元价格3070的性能特斯拉V100显卡保姆使用教程

300元价格3070的性能特斯拉V100显卡保姆使用教程

严打VPN不到一个月就烂尾？什么力量让习近平不得不收手？高善文|大老王|鲁社长|任剑涛|张维迎

严打VPN不到一个月就烂尾？什么力量让习近平不得不收手？高善文|大老王|鲁社长|任剑涛|张维迎

Pi Agent：比Claude Code和Codex更适合普通人的AI工具

Pi Agent：比Claude Code和Codex更适合普通人的AI工具

什么是嵌入式，AI时代嵌入式还有机会么，如何学习嵌入式？

什么是嵌入式，AI时代嵌入式还有机会么，如何学习嵌入式？

Qwen3.6 27B,多种优化方式，从20t/s飙到184t/s,我是怎么做到的？

Qwen3.6 27B,多种优化方式，从20t/s飙到184t/s,我是怎么做到的？

几天烧光$5000美元后，我开始琢磨怎么用本地模型省钱——结果发现...

几天烧光$5000美元后，我开始琢磨怎么用本地模型省钱——结果发现...

这颗npu让我看到了arm的未来很美好！

这颗npu让我看到了arm的未来很美好！

最近爆火的 Harness Engineering 到底是个啥？一期讲透！

最近爆火的 Harness Engineering 到底是个啥？一期讲透！

FPGA深度拆解：不只是接口扩展，更是大模型时代的自适应核心。

FPGA深度拆解：不只是接口扩展，更是大模型时代的自适应核心。

TPU 全面了解

TPU 全面了解

全新開源AI GLM 5.2問世，直接「虐殺」GPT-5.5！

全新開源AI GLM 5.2問世，直接「虐殺」GPT-5.5！

AI时代的权利版图-硅基大脑之XPU

AI时代的权利版图-硅基大脑之XPU