pytorch－Haibin's blog

Pytorch ATen Matmul CPU 算子解析

在上一期 https://www.haibinlaiblog.top/index.php/llm-on-cpu/ ，我们探讨了各个LLM的具体结构，今天我们就来探寻这些结构/算子的底层实现。上一期我们探讨的架构：LLM各阶段的代码在pytorch的实现 Pytorch调用栈解析所以你这边就能看到Pytorch的调用核心逻辑了。它会先决定做什么算子，什么数据。然后回call_impl，此时它会

Frameworks
Haibin
2025-06-12
904 Views
0 Comments

Pytorch Intro: Everything you want to know

Pytorch 本质是和python完全不一样的东西。然后这东西本质是拿来训练模型的，其他的事情它干的一般般的。学习链接官方教程 Welcome to PyTorch Tutorials — PyTorch Tutorials 2.7.0+cu126 documentation Learning PyTorch with Examples — PyTorch Tutorials 2.7.0+c

Machine Learning
Haibin
2025-06-11
655 Views
0 Comments

LLM on CPU 推理流程python源码解析

其他框架解析： vllm 框架解析：LLM 高速推理框架 vLLM 源代码分析 / vLLM Source Code Analysis - 知乎 vLLM: Easy, Fast, and Cheap LLM Serving with PagedAttention | vLLM Blog llama.cpp llama.cpp源码解读--推理流程总览 - 知乎纯新手教程：用llama.cpp本地

Frameworks
Haibin
2025-04-18
1755 Views
0 Comments