JRY's digital garden

Tag: AI

25 items with this tag.

  • Dec 06, 2025

    Xtuner:大模型微调快速上手

    • AI
    • 微调
  • Dec 06, 2025

    pytorch初级

    • AI
  • Dec 06, 2025

    swift框架中swift_output输出的是什么

    • AI
  • Dec 06, 2025

    transformer中QKV矩阵分别代表什么

    • AI
  • Dec 06, 2025

    warmup_ratio (预热比例)

    • AI
  • Dec 06, 2025

    关于Transformer和MoE框架的一点思考

    • AI
  • Dec 06, 2025

    面向知识的检索-增强生成综述

    • AI
    • RAG
  • Dec 06, 2025

    洞穴之喻

    • 哲学
    • 心理
    • AI
    • 数学
  • Dec 06, 2025

    DataLab 基于LLM的统一BI平台

    • AI
    • 大数据
  • Dec 06, 2025

    Transformer

    • AI
  • Dec 06, 2025

    第8课 KV Cache 原理讲解

    • AI
  • Dec 06, 2025

    第9课 MHA、MQA、GQA各种注意力变种机制讲解

    • AI
  • Dec 06, 2025

    别做电子仓鼠了:我是怎么把“囤积”变成“输出”的

    • 知识
    • AI
  • Dec 06, 2025

    第10课 Sparse Attention & Infini Attention 稀疏注意力和无限注意力

    • AI
  • Dec 06, 2025

    第11课 Sinusoidal、RoPE、ALiBi等各类位置信息编码

    • AI
  • Dec 06, 2025

    第12课 LoRA、QLoRA 讲解

    • AI
  • Dec 06, 2025

    第13课 GPTQ、AWQ、GGUF等模型量化概念讲解

    • AI
  • Dec 06, 2025

    第1课 什么是线性变换 Linear Transformation

    • AI
  • Dec 06, 2025

    第2课 大模型的Temperature、Top-P、Top-K、Greedy Search、Beem Search

    • AI
  • Dec 06, 2025

    第3课 Scaling Law & 模型计算量介绍

    • AI
  • Dec 06, 2025

    第4课 手写 Model.py 大模型代码逻辑

    • AI
  • Dec 06, 2025

    第5课 手写 Train.py 大模型代码逻辑

    • AI
  • Dec 06, 2025

    第6课 手写 Inference.py 大模型代码逻辑

    • AI
  • Dec 06, 2025

    第7课 Flash Attention 原理讲解

    • AI
  • Dec 06, 2025

    AI的“语言通胀”

    • AI

Created with Quartz v4.5.1 © 2025

  • GitHub
  • Discord Community