- Latest Articles
- Computer Science
- Books Reading
- CPP
- OS
- Graph
- Big Data
MINEDRAFT: A Framework for Batch Parallel Speculative Decoding
MINEDRAFT: A Framework for Batch Parallel Speculative Decoding 把推测解码打成mini batch,随后在drafter和verifier上分批处理。 在vllm上修改,工程量可观。不错的尝试和idea。 Architecture overview of MINEDRAFT. (Left) The Scheduler manages r
- Paper Reading
- Haibin
- 2026-03-23
- 118 Views
- 0 Comments
pre-PhD: thinking & planning
来MSRA后,与很多人进行了观点交流和碰撞,真是开拓眼界了。信息密度大,可是任务紧凑,没能每一个idea都细细分析,在这里只能把他们大杂烩。如果有冲突或者重合,纯属个人臆想。 我目前最想去寻找的答案,就是未来5年的phd要做什么。时代的变动非常激烈,在AI的冲击下,传统的system以及HPC的研究方法、方向乃至思路都有可能发生翻天覆地的变革。 System 研究要追上Agent 步伐 古法编程一
S.H.I.T 中国青年虚无主义体验的形成机制与生命意义重建路径研究
paper link: https://shitjournal.org/preprints/7bce9b92-88ef-4f58-ad9b-e84850799939 文章探讨了为什么很多中国青年(初中生、高中生以及大学生)陷入迷茫与虚无主义 1. 为什么会形成虚无主义 文章章节1、2节讨论了这一问题。 作者认为,大部分中国青年最初生长在封闭环境(如学校、家庭)。其环境的封闭性体现在:对人生目标这一
(WIP) 梁漱溟 中国文化要义
认识老中国,建设新中国 梁在书的前言中介绍了为什么写这本书:为中国问题所困挠,希望从文化中找到解答。 本书一名《中国民族之前途》。内容分上下两部:上半部为认识中国 问题之部,下半部为解决中国问题之部――因要解决一个问题,必须 先认识此一问题。中国问题盖从近百年世界大交通,西洋人的势力和 西洋文化蔓延到东方来,乃发生的。要认识中国问题,即必得明白中 国社会在近百年所引起之变化及其内外形势。而明白当初
- Books Reading
- Haibin
- 2026-03-09
- 128 Views
- 0 Comments
Maxime Gonthier – GPU data locality and out-of-core task scheduling
title brief introduction: time line videos links (personal only): https://www.bilibili.com/video/BV13KAkzcECz/?vd_source=4871cfa497362c1a843af2ecff18ab7f basic question \\ 先测一个简单版本,如2min,然后知道计算时间,接着进行5
Agent + Website
WebTactix Semantic Tree-Guided Parallel Multi-Agent Planning for Web Task — 基于语义树引导的并行多代理规划框架。 将任务变成搜索树 Agent并行的BFS去决策完成最佳搜索 任务预处理 将用户请求转换成明确的约束集合,这样可以清晰地检测任务是否完成。 简化观察 (AxTree) 把原始的网页可访问性树转换为简化文本版的 A
- Frameworks
- Haibin
- 2026-02-10
- 348 Views
- 0 Comments
SCA26 Trip to Japan
可能是一篇比较流水账的游记,提前磕个头说个抱歉( PS: 我插入了一些歌曲在行程中,欢迎点击来听听 🙂 时隔九年,我再次踏上关西的土地。 飞机降落在关西国际机场,摆渡车玻璃厚实,却显出深圳未曾有的清凉,混合着机场里特有的淡淡的、干燥的清洁剂味。阳光在金属扶手上跳跃,窗外运行李的小车有条不紊地卸货,更远处是静默的塔台与深蓝的大海。 九年一瞬,这些情景仿佛昨日。很多坐标没有变,但坐标系里的人与故事天翻
ISCA25 Neoscope: How Resilient Is My SoC to Workload Churn?
未来的硬件怎么应对不断演变的软件? https://dl.acm.org/doi/pdf/10.1145/3695053.3731014 这篇文章是 ISCA 2025 的论文 《Neoscope: How Resilient Is My SoC to Workload Churn?》,核心在回答一个非常系统/架构导向的问题: 当软件和工作负载不断演进(churn)时,一个 SoC 设计在整个生命
- Paper Reading
- Haibin
- 2026-02-01
- 238 Views
- 0 Comments
ATC25 Colocating ML Inference and Training with Fast GPU Memory Handover
今天yf来分享一篇来自IPADS的ATC25文章。 Colocating ML Inference and Training with Fast GPU Memory Handover 简短点评:依旧IPADS特有的大工程,TVM+vLLM+NCCL+Pytorch 开组会大家一起问了很多问题。 https://ipads.se.sjtu.edu.cn/_media/publications/si
- Paper Reading
- Haibin
- 2026-01-15
- 370 Views
- 0 Comments
STOC81 I/O Complexity: The Red-Blue Pebble Game
STOC81 I/O Complexity: The Red-Blue Pebble Game 这是一篇理论计算机科学文章,但是描述了一个非常有趣的问题:就像时间复杂度一样,我们能不能做一个I/O复杂度,衡量一个程序最少要进行多少次I/O? 文章链接: https://www.eecs.harvard.edu/~htk/publication/1981-stoc-hong-kung.pdf Com
- Paper Reading
- Haibin
- 2026-01-09
- 338 Views
- 0 Comments
In-depth analysis: RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference
之前用LLM看文章,后来发现同样20分钟时间,学到的东西其实不如自己认真读读+关键问题请教。 KVCache可以用上 RAG 技术吗? 这篇文章的idea是:能不能 "build KVCache as a Vector Storage System." 在长上下文情况中,KVCache经常超出显存,那么我们只能把多余的KVCache存进CPU内存里。而这样就很慢(CPU-GPU
- Paper Reading
- Haibin
- 2026-01-08
- 533 Views
- 0 Comments
Task-based Parallelism models and their techniques Overivew
So far there are many task programming models. Charm++ Website: https://charmplusplus.org/applications/ Github: https://github.com/charmplusplus/charm Tutorial: https://charm.readthedocs.io/en/latest/
- High Performance Computing
- Haibin
- 2026-01-07
- 354 Views
- 0 Comments
Distributed and Cloud Computing Assignment 4
Feedback Feedback to Learner 12/30/25 3:55 PM 82+5=87 (extra: 0) > Summary: As we demonstrated in the lab, you should pre-assign labels and taints to cluster nodes using Kind config YAML. Other parts
- Distributed Systems
- Haibin
- 2026-01-07
- 302 Views
- 0 Comments
America Against America
美国反对美国 第一次系统性思考美国,始于高中时读林达夫妇的《历史深处的忧虑》。后来又看了托克维尔的《论美国的民主》。再然后到今天 Hu\'ning Wang 的《美国反对美国》。几个来自不同时间、不同国籍、不同立场的作者在他们的书里,对美国政治、经济、文化进行了多方面的观察。于我而言,我也从纪录片到真正踏上这块陌生的土地过上半年生活。再重新思考书里提到的一切,有了很多新的体验。 同样是游历半年,王考
- Books Reading
- Haibin
- 2026-01-04
- 902 Views
- 0 Comments
Learn Compilers in 6 hours
半个学期在申请,半个学期在忙paper,基本上没怎么动过这个课程。但是课程整体考试是不难的。 高效“备考” 周一下午16:30的考试,我从周一凌晨3点开始学,早上9点结束。睡5小时下午2点起床吃早餐+洗澡,然后考试,69/100。 反正大四了,过了就行,分数就图一乐。 这个人讲的最好,古希腊掌管编译器的神明。只讲题目,全程干货。 【【武汉大学】编译原理混子速成——面向期末试卷复习:全集】 http
Distributed Systems and Cloud Computing: Review 1
This is the self-review pack of Distributed Systems and Cloud Computing. We have lesson 1-5. Lesson 1 Presentation – Effective communication of information rather than of data – Code and number conver
- Distributed Systems
- Haibin
- 2025-12-30
- 372 Views
- 0 Comments
DnCC3: Introduction to Spark
In this assignment, we need to use Spark to analyze the Parking dataset. Preparing Install pysark and java pip install pyspark sudo apt-get update sudo apt-get install openjdk-17-jdk export JAVA_HOME=
- Distributed Systems
- Haibin
- 2025-12-30
- 470 Views
- 0 Comments
DnCC Assignment 1: Parallel Matrix Multiplication
https://github.com/HaibinLai/Distributed-and-Cloud-Computing.git 【分布与云计算 - DnCC 复习】 https://www.bilibili.com/video/BV1eovaBTEW9/?share_source=copy_web&vd_source=72eac555730ba7e7a64f9fa1d7f2b2d4 Setup
- Distributed Systems
- Haibin
- 2025-12-30
- 352 Views
- 0 Comments
A Simple Merch Store Backend: Distributed and Cloud Computing Assignment 2
Scores 95+10=105 (extra: 5) Summary: The impl is nice in general, and the report is awesome! Yes, this is an assignment where you should follow certain instructions and submit certain stuff, but just
- Distributed Systems
- Haibin
- 2025-12-30
- 697 Views
- 0 Comments
