Rowhammer 行锤攻击

Intro Learn from Prof. Onur Mutlu: https://www.youtube.com/live/mEt-hhLHBG4?si=TsmRN04wcqbcQs0e Rowhammer(行锤攻击) 是一种硬件层面的安全漏洞,主要发生在 DRAM 内存 中。攻击者不需要破解软件或操作系统,只要反复高速访问(“hammer”)同一行或相邻行内存,就有可能导致相邻内存行的比特翻

GNU OpenMP是怎么结束的

gcc/libgomp/config/posix/simple-bar.h at 4e47e2f833732c5d9a3c3e69dc753f99b3a56737 · gcc-mirror/gcc gcc/libgomp/parallel.c at e2bf0b3910de7e65363435f0a7fa606e2448a677 · gcc-mirror/gcc void GOMP_paralle

OpenMP的barrier同步

do_release: if (nested) gomp_barrier_wait (&team->barrier); else gomp_simple_barrier_wait (&pool->threads_dock); /* Decrease the barrier threshold to match the number of threads that sho

OpenMP 绑定核跟线程

for (; i < nthreads; ++i) { int err; start_data->ts.place_partition_off = thr->ts.place_partition_off; start_data->ts.place_partition_len = thr->ts.place_partition_len; start_data->p

proc_bind 各策略的 place 计算逻辑、affinity_thr 的内存管理,gomp_simple_barrier_reinit 如何保证同步

很好!你提的这三个点都直指 GOMP_parallel 线程调度核心机制。我们逐一详细剖析这三项: 🔢 一、proc_bind 各策略下的 place 计算逻辑 这个逻辑体现在你贴出的代码中 switch (bind) 语句块下的 线程 affinity 计算部分,其作用是:为第 i 个线程计算它应绑定的 place_partition_off 和 place_partition_len。 pro

微专题:MESI

全知乎最详细的并发研究之CPU缓存一致性协议(MESI)有这一篇就够了! - 知乎 多核CPU多级缓存一致性协议MESI 多核CPU的情况下有多个一级缓存,如何保证缓存内部数据的一致,不让系统数据混乱。这里就引出了一个一致性的协议MESI。 MESI协议缓存状态 MESI 是指4中状态的首字母。每个Cache line有4个状态,可用2个bit表示,它们分别是: 缓存行(Cache line):缓

1-bit量化

用AI生成的。省着点看。 1-bit大模型指的是采用1-bit量化(即权重仅用+1或-1表示)的神经网络模型,具体在本文件中指的是BitNet,一种专为大规模语言模型设计的1-bit Transformer架构。以下是关于BitNet和1-bit大模型的关键点总结: 1. 什么是BitNet? BitNet 是一种1-bit Transformer架构,通过将模型权重量化为1-bit(二值化,+1

std::unordered_map

是的,std::unordered_map 的本质是 哈希表,而 std::map 是基于 红黑树 的有序容器。 让我们来详细了解一下 哈希表 是如何实现的,特别是在 unordered_map 中是如何工作的。 1. 哈希表的基本原理 哈希表是基于哈希函数的概念,哈希函数将 键(key) 转换为一个固定大小的数组索引。哈希表的核心结构通常是一个数组,数组中的每个位置叫做 桶。元素通过哈希函数计算

Worst-Case Optimal Join

最坏情况下最优连接(Worst-Case Optimal Joins) - 知乎 _Amine Mhedhbi and Semih Salihoglu. 2019. Optimizing subgraph queries by combining binary and worst-case optimal joins. Proc. VLDB Endow. 12, 11 (July 2019), 1

CSR与邻接表的内存开销对比

邻接列表(Adjacency List) 和 压缩稀疏行(CSR,Compressed Sparse Row) 是两种常见的图表示方法,它们的空间效率在不同情况下有所差异。具体来说,哪个表示法更节省空间,取决于图的稀疏程度和实际的存储需求。 1. 邻接列表(Adjacency List) 在邻接列表中,每个顶点有一个列表,存储与该顶点相邻的所有顶点。每个顶点的邻接列表可能包含不同数量的邻居,因此每