• 最新文章
  • 计算机科学
  • 读书笔记
  • CPP
  • OS
  • 图论
  • 交叉学科
  • 大数据
  • 微专题
  • 转载文章

The Old Man and the Sea 劳而不获

《老人与海》发生在上世纪的古巴,那个离我和我的世界很远的地方。一个渔夫钓上一条大鱼,随后与风暴中的鲨鱼搏斗,最终鱼肉都被它们啃食干净,只带回了鱼骨。 高中的我很不解。一个拼尽全力却无功而返的故事,听起来没什么意义。我不解老人到底在想什么,为何要去进行一场毫无意义的搏斗。简直和堂吉柯德一样,执拗而又带有一点愚笨和悲哀。 老人与海。有人说这是他见过最不对等的两个事物放在同一个标题里。老人有什么能力跟大

怎么用AI写2000行的大作业

最近分布式课程有一个作业。作业内容是要写一个商城的后端。商城消费者通过网页API访问/消费商品,后端商品数据库有CRUD、产品消费消息订阅服务。分解开来,要有OpenAPI Service后端接口服务,Database Service数据库服务和logging Service日志服务,3个微服务全上docker,工程量2000-3000行python。 这个作业在我与GPT、Deepseek的配合

AI Compiler Group Meeting

109 pages PPT,from TVM to Mirage. Introducing AI Compiler 101. Cost 90 minutes. PPT and videos: https://drive.google.com/drive/folders/1eKcHZKMpix31EcioiNCf16AzLIHkvGyy?usp=sharing

现在的学生缺乏对大型工程动刀子的能力

我的接触的同学和我的观察力都比较有限。但是在这些天做研究、跟朋友聊科研,问大家迷茫/卡在哪,都感受到这一点。 现在的学生缺乏对大型工程动刀子的能力。 XX github proj 跑不起来。编译/安装阶段超过10条命令就束手无策。超过30页的文档找不到对应的命令。甚至连问GPT都问不明白 ...... 以前总有学生吐槽说,实验室里学长不愿意带学生。但是没有基础实在是太难带了,简直是拖累节奏,并且心

神文解析:AVX 是怎么让你的CPU频率更慢的?

GB! 本文依旧是超神作者 Travis Downs https://x.com/trav_downs 的技术博客解读。文章链接 Gathering Intel on Intel AVX-512 Transitions https://travisdowns.github.io/blog/2020/01/17/avxfreq1.html 本文是在其基础上的分析与解读,若内容涉及侵权,请与我联系,我

Can Tensor Cores Benefit Memory-Bound Kernels? (NO!)

本文学习自 Can Tensor Cores Benefit Memory-Bound Kernels? (NO!) https://dl.acm.org/doi/pdf/10.1145/3725798.3725803 这篇文章提出了一个有点惊人的观点:Tensorcore在面对 memory bound 的kernel/算子时效果并不是很好!文章用优秀的理论公式分析+实验验证了这点。读懂这篇文章

Where do interrupts happen? 中断触发点在OOO处理器中的分布——神文解析

神文解析:Where do interrupts happen? 原文: https://travisdowns.github.io/blog/2019/08/20/interrupts.html 看完标题和第一句话,我就知道今晚这篇文章要让我睡不着了。看懂这篇文章需要一定的体系结构基础,对OoO,中断的机制比较了解。 在中文网站上我似乎没有看到类似的讨论。在考虑后,我决定将本文写为解析。我会将我

Why Greatness Cannot Be Planned

看到一些退休的prof的谷歌学术,做了30年,40多篇文章。仔细一想,人的一生不也就是这些文章和产出。一年一篇工作,不算那些挂名的,似乎也就能发个30来篇,从此之后,就没什么文章了。 5年phd看起来很长,其实好像也就是3-5个关键项目,如果其中有一个改变了世界,已经很不得了了。15年的工作看起来很长,其实也就是那几个项目,改变的机会在哪里? 一万年太久,只争朝夕。 Thanks to the a

Distributed System 5: Bayou Algorithm

分布式一致性 怎么在弱网情况下保证事件一致性,弱网指的是,只能时不时连接一下 Bayou算法 Bayou 是 1990 年代中期由 Xerox PARC 提出的一个早期分布式协作数据库系统(由 Terry、Demers、Pajankar 等人设计),它是后来 eventual consistency 和 CRDT 等思想的先驱之一。 它最初是为了移动设备和断网协作编辑场景设计的——在当时笔记本、P

Distributed System 4: Distributed Snapshots

Snapshots: save the data 我们想要捕捉系统在某一时刻 TTT 的一致全局状态,包括: 每个进程的本地状态; 每条通道上的消息状态(即“正在飞”的消息)。 常见应用场景: 检查点恢复(Checkpoint / Rollback Recovery) 检测全局死锁 检测全局不变式(如是否所有账户加和为常数) 调试 / 稳定状态检测(如终止检测) 问题是: 在分布式系统中没有全局时

Distributed System 3: Vector Clock

Review: Time is important in Distributed, for determine sequence. But we can\'t find a sync time for everyone. Vector Clock Lamport didn\'t solve: Solution: use a vector clock 两个向量一样:同一个事件 一个向量小于另一个向量:所

GridFTP: SC25 Test of Time Award

How to move massive data from server to client? How to serve multiple users around the world to use the compute machine? This technology was not invented in cloud computing, but grid computing. And th

Compiler 4: CFG, Parsing

CFG Terminal: 对应loop,对应if,对应XX Productions: 产生式 Derivation推导 CFG可以推导很多不同的式子 Notations Terminologies 文法的句型 这里我们看到,文法 最左推导 & 最右推导 在编译原理中,最左推导和最右推导都是从文法的开始符号(Start Symbol)出发,通过不断用产生式替换非终结符,逐步推导出一个句子的

Compiler 2: Regrex, Finite Automata

语言运算 Regular Expression 形式语言 For describing Languages / Patterns if, else, ... 形式化定义正则表达式(regular expression, regexp),给出了一系列归纳规则(induction rules) Basic $\\epsilon$ is a regexp, $L(\\epsilon) = {\\epsilon

Compiler 3: NFA, DFA, CFG

第一章最后一部分+CFG Convert NFA to DFA The algorithm here is to explore the state 是在move后能达到的所有状态 !] 我们用达到闭包的个数,来判定目前的状态 Start State A (We have 0), Acce