• 最新文章
  • 计算机科学
  • 读书笔记
  • CPP
  • OS
  • 图论
  • 交叉学科
  • 大数据
  • 微专题
  • 转载文章

Can Tensor Cores Benefit Memory-Bound Kernels? (NO!)

本文学习自 Can Tensor Cores Benefit Memory-Bound Kernels? (NO!) https://dl.acm.org/doi/pdf/10.1145/3725798.3725803 这篇文章提出了一个有点惊人的观点:Tensorcore在面对 memory bound 的kernel/算子时效果并不是很好!文章用优秀的理论公式分析+实验验证了这点。读懂这篇文章

Where do interrupts happen? 中断触发点在OOO处理器中的分布——神文解析

神文解析:Where do interrupts happen? 原文: https://travisdowns.github.io/blog/2019/08/20/interrupts.html 看完标题和第一句话,我就知道今晚这篇文章要让我睡不着了。看懂这篇文章需要一定的体系结构基础,对OoO,中断的机制比较了解。 在中文网站上我似乎没有看到类似的讨论。在考虑后,我决定将本文写为解析。我会将我

Why Greatness Cannot Be Planned

Thanks to the authors. Drop me an email if you do not want your videos/articles listed here. Videos for shaping your mind 【毕业后第一份工作和前几年积累什么最重要】 https://www.bilibili.com/video/BV1214y1X7Yx/?share_sourc

Distributed System 5: Bayou Algorithm

分布式一致性 怎么在弱网情况下保证事件一致性,弱网指的是,只能时不时连接一下 Bayou算法 Bayou 是 1990 年代中期由 Xerox PARC 提出的一个早期分布式协作数据库系统(由 Terry、Demers、Pajankar 等人设计),它是后来 eventual consistency 和 CRDT 等思想的先驱之一。 它最初是为了移动设备和断网协作编辑场景设计的——在当时笔记本、P

Distributed System 4: Distributed Snapshots

Snapshots: save the data 我们想要捕捉系统在某一时刻 TTT 的一致全局状态,包括: 每个进程的本地状态; 每条通道上的消息状态(即“正在飞”的消息)。 常见应用场景: 检查点恢复(Checkpoint / Rollback Recovery) 检测全局死锁 检测全局不变式(如是否所有账户加和为常数) 调试 / 稳定状态检测(如终止检测) 问题是: 在分布式系统中没有全局时

Distributed System 3: Vector Clock

Review: Time is important in Distributed, for determine sequence. But we can\'t find a sync time for everyone. Vector Clock Lamport didn\'t solve: Solution: use a vector clock 两个向量一样:同一个事件 一个向量小于另一个向量:所

GridFTP: SC25 Test of Time Award

How to move massive data from server to client? How to serve multiple users around the world to use the compute machine? This technology was not invented in cloud computing, but grid computing. And th

Compiler 4: CFG, Parsing

CFG Terminal: 对应loop,对应if,对应XX Productions: 产生式 Derivation推导 CFG可以推导很多不同的式子 Notations Terminologies 文法的句型 这里我们看到,文法 最左推导 & 最右推导 在编译原理中,最左推导和最右推导都是从文法的开始符号(Start Symbol)出发,通过不断用产生式替换非终结符,逐步推导出一个句子的

Compiler 2: Regrex, Finite Automata

语言运算 Regular Expression 形式语言 For describing Languages / Patterns if, else, ... 形式化定义正则表达式(regular expression, regexp),给出了一系列归纳规则(induction rules) Basic $\\epsilon$ is a regexp, $L(\\epsilon) = {\\epsilon

Compiler 3: NFA, DFA, CFG

第一章最后一部分+CFG Convert NFA to DFA The algorithm here is to explore the state 是在move后能达到的所有状态 !] 我们用达到闭包的个数,来判定目前的状态 Start State A (We have 0), Acce

Compiler: Intro

Operations on Languages Languages: accountable for strings Lexer Lexical Analyzer(词法分析器,也叫 Scanner)在编译器中扮演着 前端第一步的角色。它的主要任务是把源代码(程序员写的字符序列)转化为 Token 序列,供后续的语法分析器(Parser)使用。下面我分点介绍它的作用: 1. 输入与输出 输入:源程序

Distributed System 2: Time

不同的机器需要同步 分布式实时操作系统研究的是 如何在分布式多节点环境中,提供确定性调度、时间同步、实时通信与容错机制,从而保证关键任务的 deadline 被满足。它既是操作系统的研究热点,也与工业控制、车联网、航空航天等应用紧密相关。 下面的图片是: 分布式系统需要同步 同步非常困难 我们是无法完全同步的,只能尽力同步 网络时间协议: Cristian\'s algorithm 我们很不幸,是无

Distributed System 1: RPC

This is a course taught in SUSTech 2025 Fall by Prof. Zhuozhao Li. RPC 为什么要有RPC 因为我们不想socket编程 Goal: Easy-to-program network communication that makes client-server communication transparent RPC 要解决的问题

ICPP25 Conference story: Day 2

Anne Elster, "Parallel Computing and Geophysical Forecasting" Professor Anne C. Elster Norwegian Univ. of Science and Technology Center for Geophysical Forecasting University of Texas at Aus

ICPP25 Conference story: Day 1

ICPP Conference 会议 Congrats to all accepted papers! Welcome Ceremony 185 Attendee come to the conference! We have 292 submission and 78 of them are accepted! The Chairman\'s Welcoming! Jack Dongarra, &