Wiki Index
This file is maintained by the LLM. Updated on every ingest.
Overview
- Overview — 五大知识领域全景综合:LLM/AI、大数据工程、量化金融、哲学经济学、读书笔记
Sources
-
第1课 线性变换 — 线性变换几何直观与矩阵表示,Transformer权重矩阵
-
第2课 解码策略 — Temperature/Top-K/Top-P/Beam Search解码策略
-
第3课 Scaling Law — 幂律关系、Chinchilla Law、FLOPs计算
-
第4课 Model.py — 从零搭建Transformer架构代码
-
第5课 Train.py — 训练管线实现:分词、优化、评估
-
第6课 Inference.py — 推理管线:模型加载、文本生成、分布式训练
-
第7课 Flash Attention — HBM/SRAM优化、Tiling分块、Online Softmax
-
第8课 KV Cache — 自回归推理缓存,56倍加速
-
GQA — 注意力变种对比,内存536MB→16MB
-
无限注意力 — Sparse Attention三组件、Infini-Attention压缩记忆
-
第11课 位置编码 — Sinusoidal/RoPE/ALiBi位置编码方案
-
QLoRA — 低秩适配微调,4-bit量化
-
第13课 模型量化 — GPTQ/AWQ/GGUF量化部署
-
Transformer深入理解 — 从编解码到注意力机制的深度拆解
-
QKV矩阵解释 — Query/Key/Value矩阵含义与计算流程
-
Transformer vs MoE — Transformer与MoE混合专家架构对比分析
-
XTuner快速上手 — 上海AI实验室大模型微调工具库实战指南
-
PyTorch初级 — Tensor/数据加载/模型搭建/训练循环/ONNX部署
-
warmup_ratio — 学习率预热比例参数的作用与取值策略
-
AI语言通胀 — 人机交互中的语言通胀现象与高效Prompt原则
-
DataLab统一BI平台 — 腾讯LLM-based一站式BI平台,领域知识+多代理协作
-
RAG综述 — 检索增强生成全景综述,基本原理到高级方法
-
Swift框架swift_output — 适配器增量权重与合并部署流程
-
Spark性能优化全景图 — 七大优化方向与排查路线图
-
Spark宽窄依赖优化 — 宽窄依赖集中处理,Shuffle减少45%性能提升
-
Spark小文件问题 — 小文件成因、危害与源头预防/自动合并/AQE方案
-
Spark数据倾斜 — 定位诊断到两阶段聚合/Broadcast Join/AQE自动处理决策树
-
Spark资源配置与并行度优化 — Executor配置、并行度公式、动态分配策略
-
Spark内存管理 — 内存模型四区域、统一内存管理、Kryo序列化、OOM诊断
-
Hive SQL语法大全 — Hive完整语法参考:DDL/DML/DQL、分区分桶、复杂类型、函数
-
数仓建模:核心方法 — ODS/DIM/DWD/DWS/ADS五层架构与Kimball维度建模精简版
-
数仓建模:核心方法和方法论 — 电商订单域完整建模案例与系统学习方法论
-
数据压缩 — IoT场景列式存储+编码+通用压缩实现5:1压缩比原理
-
数据治理之SLA — SLI/SLO/SLA框架、四种数据SLA类型与设计落地八步法
-
阿里巴巴大数据之路笔记 — 阿里大数据平台实践:技术架构、数据模型、数据管理
-
性能优化三层框架 — 数据源头+SQL语句+计算引擎三层优化体系
-
洞穴之喻 — 柏拉图洞穴之喻、柏拉图表征假说与AI的局限性
-
平庸之恶 — 阿伦特平庸之恶概念:放弃独立思考如何使普通人成为帮凶
-
儒家的失守 — 宋朝儒家面临佛教道教冲击时的阵地失守
-
慧能和一元论、二元论 — 慧能分别心、庄子内心修养与一元论的联系
-
形而上和经验主义 — 形而上学与经验主义的张力及康德的调和
-
忒修斯之船、阿能诃鼓、金阁寺 — 事物同一性的哲学追问
-
毒箭之喻:应对间歇性努力 — 佛陀毒箭之喻应用于克服间歇性努力
-
岩中花树的故事 — 王阳明心学中存在与感知的关系
-
公地的悲剧 — 个体理性与集体理性冲突导致资源耗竭
-
亚里士多德《政治学》中的高利贷 — 目的论视角下利息”不自然”的论证
-
从法律经济学角度了解公平效率 — 科斯定律下的公平与效率权衡
-
经济学中”知识”的了解 — 哈耶克关于知识分散性和价格机制
-
经济学大师哈耶克 — 哈耶克生平、思想与知识论
-
关于历史认知、信息筛选与不变规律的思考 — 历史中不变规律与信息筛选系统
-
关于占卜的不可证伪性 — 占卜系统不可证伪性的逻辑分析与心理机制
-
为何西方领袖常被调侃 — 中西政教关系差异对领袖形象的影响
-
孔子面孔的演变 — 孔子形象在中国历史上的六次重大转变
-
对孔子人生阶段的另一种解释 — 孔子”吾十有五而志于学”的重新解读
-
十三邀对话马东 — 许知远与马东关于文化、娱乐与时代的对话
-
十四无忌 — 佛陀拒绝回答的十四个形而上学问题
-
卡农、赋格 — 复调音乐形式中的数学对称之美
-
吴军:成长的三个维度 — 看得远、看得透、看得开
-
姜文:什么是电影的台词 — 电影台词的深层含义与艺术表达
-
《信条》和萨托方块 — 时间循环哲学与回文结构
-
与AI的一次对话:认知的边界 — 希尔伯特、佛陀、康德揭示理性极限
-
别做电子仓鼠了 — IPO模型:从数字囤积到知识输出
-
如何扩大受众—Dan Koe — AI时代内容创作的品味与使命导向策略
-
读书和思考的一点思考1 — 叔本华论读书与思考,AI时代的IPO模型
-
读书和思考的一点思考2 — 用边际分析重新诠释读书与思考的平衡
-
赵鼎新:r策略与K策略 — 生态学r/K策略对企业发展和个人成长的启示
-
《当下的力量》 — 托利:强迫性思考是痛苦根源,意识是思维的主人
-
《活出生命的意义》 — 弗兰克尔:意义疗法,发现生命意义的三种途径
-
BRAIN兼职顾问指南 — WorldQuant BRAIN平台兼职顾问的完整入门指南
-
BRAIN量化学习体系 — WorldQuant三阶段量化学习体系:入门/进阶/高阶
-
BRAIN自学路径图 — BRAIN平台入门自学资源汇总,四大模块链接
-
Claude Code实践1:Obsidian Skills — AI 编程助手操作 Obsidian 笔记库的 MCP 技能包
-
Claude Code实践2:Tutorial 阅读心得 — 构建 AI 协作系统:规划/CLAUDE.md/Subagents/MCP 工作流
-
巴菲特致股东信全集 — 1957-2024共67封年度股东信,价值投资最重要的原始文献
Buffett Annual Letters
-
巴菲特:伯克希尔50年回顾 — 亲述伯克希尔的过去、现在与未来
-
芒格:伯克希尔50周年评论 — 芒格对伯克希尔50年的总结
Smart Manufacturing(智能制造)
- 智能制造概述与工业4.0 — 四次工业革命演进与智能制造技术支柱全景
- ISA-95参考架构 — 企业-控制系统集成的五层层级模型
- 中国智能制造能力成熟度模型 — CMMM五级成熟度十大能力域评估体系
- 工业互联网参考架构IIRA — 美国IIC四重视角与三层架构
- 数字孪生 — 物理层/虚拟层/连接层三层架构与制造应用
- 工厂数据平台总体架构 — 五层分层架构,Kafka+Flink+Doris+Iceberg技术栈
- 数据采集层架构 — OT/IT/外部三大数据源与工业协议设计
- 时序数据库选型 — InfluxDB/TDengine/IoTDB五款对比分析
- 实时与离线统一架构 — Lambda/Kappa/湖仓一体三种范式
- 实时数据流水线 — Flink/Kafka实时OEE计算与告警引擎
- 工厂数据仓库建模 — 五大主题域四层架构与时序聚合建模
- 数据服务与API层 — 指标API/报表服务/看板选型与治理
- 数据血缘与元数据管理 — 字段级/表级/应用级血缘与元数据管理
- 工厂主数据管理 — 设备/物料/工艺/人员五大主数据与编码治理
- 工业数据治理框架 — 五层治理体系与OT/IT融合治理模型
- 工业数据质量 — 六维度质量评估与检测-隔离-修复闭环流程
- MES制造执行系统 — ERP与SCADA之间的核心生产执行管理
- ERP企业资源计划 — 整合企业核心业务流程的统一信息平台
- SCADA数据采集与监视 — 实时设备数据采集与集中监视控制系统
- PLM产品生命周期管理 — 产品从概念到退市全生命周期数据管理
- QMS质量管理系统 — 全生命周期质量数据与检验流程管理
- WMS仓储管理系统 — 仓库全流程管理,库存准确率98-99.5%
- CMMS设备维护管理 — 设备维护工单/备件/维修记录信息化平台
- OEE设备综合效率 — 可用率×性能率×质量率,核心生产绩效指标
- 可用率Availability — OEE三要素之一,设备实际运行时间比例
- 性能率Performance — OEE三要素之一,实际速度与理论速度比值
- 质量率Quality — OEE三要素之一,合格品占总产量比例
- 产能利用率 — 实际产出与最大理论产能的比值
- 良率Yield — 投入原料转化为合格品的效率,链式乘积效应
- FPY直通率 — 首次通过率,不经过返工一次性合格比例
- MTBF平均故障间隔 — 设备两次故障间平均运行时间
- MTTR平均修复时间 — 故障到恢复的平均时间,五阶段全链路
- 节拍时间Takt Time — 满足客户需求每件产品允许的最大时间
- SPC统计过程控制 — 统计控制图区分普通/特殊原因变异
- Cpk过程能力指数 — 量化过程在规格限制内生产的能力
- 视觉质检 — 从传统CV到深度学习到视觉大模型的缺陷检测
- 质量管控流程 — IQC/IPQC/FQC/OQC全生命周期质量体系
- 工艺参数优化 — DOE到贝叶斯优化到强化学习的方法演进
- 智能排产 — ML预测+运筹优化+实时反馈的动态排程
- APS生产计划与排程 — 有限产能建模与多约束优化排程
- 能耗优化 — 削峰填谷、空压机群控与碳足迹跟踪
- 异常检测与根因分析 — 统计/ML/DL检测+知识图谱追溯根因
- 设备管理全流程 — 从反应性维修到数据驱动全生命周期管理
- OEE损失分析 — 六大损失分解与帕累托分析优先改进
- 预测性维护 — 传感器数据预测设备健康,降本30-50%
- 生产执行与报工 — APS排程到车间指令的MES核心模块
- 物料管理与拉动 — 看板+JIT配送+WMS集成的精益物料系统
- 生产成本指标体系 — OEE/良率/技术指标到经济语言的转化
- 工业数据安全 — OT/IT融合安全,ISA-95分层防御与等保2.0
Entities
- DeepMind — Google旗下AI实验室,Chinchilla Law
- Google — Big Bird稀疏注意力,Gemini长上下文
- HuggingFace — 开源ML平台,Transformers库
- Kimi — 中国AI公司,长上下文应用
- Meta — LLaMA系列模型
- MistralAI — 法国AI公司
- OpenAI — GPT系列创建者
- PyTorch — 深度学习框架
- TriDao — Flash Attention作者,Stanford
- WeightsAndBiases — ML实验跟踪平台
- XTuner — 上海AI实验室大模型微调工具库
- SWIFT — 阿里达摩院大模型微调框架
- DataLab — 腾讯一站式LLM-based BI平台
- Shanghai AI Lab — 上海人工智能实验室,InternLM/XTuner
- Confucius — 儒家创始人,孔子形象在不同时代的六次转变
- Plato — 古希腊哲学家,洞穴之喻、理念世界
- Aristotle — 古希腊哲学家,目的论、形而上学奠基人
- Hayek — 奥地利-英国经济学家,知识论、自由市场
- DanKoe — 内容创作者,AI时代品味与使命导向策略
- WuJun — 计算机科学家/作家,成长三维度
- Eckhart Tolle — 心灵导师,《当下的力量》作者
- Viktor Frankl — 意义疗法创始人,集中营幸存者
- Warren Buffett — 价值投资旗手,伯克希尔董事长,1957-2024年度股东信作者
- Charlie Munger — 伯克希尔副董事长,推动投资哲学从”便宜”到”优质”
- Berkshire Hathaway — 全球最大控股公司之一,保险浮存金+资本配置模式
- WorldQuant — 全球量化投资公司,BRAIN平台运营方
- ISA-95 — 企业系统与控制系统集成的国际标准
Concepts
- ALiBi — 线性偏置位置编码(概念页见PositionalEncoding)
- DecodingStrategy — 解码策略:Greedy/Beam/Top-K/Top-P/Temperature
- FineTuning — 微调技术:全参数/LoRA/QLoRA
- FlashAttention — Tiling分块+Online Softmax,HBM访问O(N²)→O(N)
- FLOPs — 浮点运算量 C≈6×N×D
- GQA — 分组查询注意力,LLaMA采用,内存536→130MB
- InfiniAttention — 压缩记忆实现无限上下文
- KVCache — 推理加速缓存,56倍提速
- LinearTransformation — 线性变换几何直观
- LoRA — 低秩适配,ΔW=B×A,参数减少99%+
- ModelQuantization — FP32→INT4量化,GPTQ/AWQ/GGUF
- MultiHeadAttention — 多头注意力,MHA/MQA/GQA演化
- PositionalEncoding — 位置编码:正弦/RoPE/ALiBi
- QLoRA — 4-bit量化+LoRA,消费者GPU微调
- RoPE — 旋转位置编码,LLaMA/Qwen采用
- ScalingLaw — 幂律关系 L(N,D)=E+A/N^α+B/D^β
- SparseAttention — 稀疏注意力 O(N²)→O(N√N)
- TrainingPipeline — 训练管线:分词→批次→前向→损失→反向→更新
- Transformer — 编码器-解码器架构,自注意力+FFN
- RAG — 检索增强生成,外部知识检索+LLM生成
- MoE — 混合专家模型,门控机制+稀疏激活
- SparkPerformance — Spark性能优化七大方向与优化路线图
- DataWarehouse — 数据仓库建模:五层架构、维度建模四步法、指标体系
- DataGovernance — 数据治理:SLA框架、五种SLA维度、四种SLA类型
- DataSkew — 数据倾斜:Shuffle中Key分布不均的定位与解决方案层次
- HiveSQL — Hive SQL:分区分桶、复杂类型、ETL模式
- PlatosCave — 洞穴之喻:表象世界vs真实世界,信息与权力
- BanalityOfEvil — 平庸之恶:放弃独立思考使普通人成为帮凶
- TragedyOfCommons — 公地悲剧:个体理性vs集体理性的冲突
- HayekKnowledge — 哈耶克知识论:知识分散性与价格机制
- CognitiveBoundaries — 认知边界:理性自限的数学/认识论/实践维度
- FairnessAndEfficiency — 公平与效率:科斯定律下的法律经济学
- FourteenUndetermined — 十四无忌:佛陀悬置的形而上学问题
- CoaseTheorem — 科斯定律:交易成本与资源最优配置
- IdentityProblem — 同一性问题:忒修斯之船、阿能诃鼓
- UnfalsifiabilityOfDivination — 占卜的不可证伪性:逻辑闭环与心理需求
- Logotherapy — 意义疗法:意义意志、悲剧乐观主义、三种意义途径
- Mindfulness — 当下觉察:强迫性思考、小我、痛苦之身、冥想消解
- ValueInvesting — 价值投资:安全边际、能力圈、复利、从格雷厄姆到巴菲特的演进
- SmartManufacturing — 智能制造:IoT+大数据+AI+数字孪生,工业4.0五层架构
- OEE — 设备综合效率:可用率×性能率×质量率,世界级≥85%
- DigitalTwin — 数字孪生:物理实体的数字映射,虚实双向交互
- IndustrialDataPlatform — 工业数据平台:五层架构(采集→存储→计算→服务→应用)