莫叶何竹🍀
Home
友情链接
联系我
归档
  •   文章分类
  •   文章标签
  •   往期文章
莫叶何竹🍀
文章
2
分类
3
标签
34
Home
友情链接
联系我
归档
文章分类
文章标签
往期文章
#transformer

🏂diffusion model(十三):DiT技术小结

学习分享
DiT 系统研究了diffusion transformer的token化和条件嵌入两个关键问题,验证了基于transformer架构的扩散模型的scalable能力。
2024-3-8
diffusion_model
transformer
diffusion model(十三):DiT技术小结

Lazy loaded imageAttention Free Transformer(AFT)技术小结

学习分享
原本基于dot product self attention Transformer的时间复杂度和空间复杂度都很高。提出了一个新的AFT层来降低transformer的计算量。
2023-9-14
transformer
Attention Free Transformer(AFT)技术小结
莫叶何竹🍀
莫叶何竹🍀
非淡泊无以明志,非宁静无以致远
文章
2
分类
3
标签
34
最新发布
多模态模型如何处理任意分辨率输入——Tiling与Packing技术详解
多模态模型如何处理任意分辨率输入——Tiling与Packing技术详解
2026-6-30
《Unlimited OCR》技术小结:用R-SWA实现长程文档解析
《Unlimited OCR》技术小结:用R-SWA实现长程文档解析
2026-6-30
多模态模型如何处理任意分辨率输入:位置编码设计
多模态模型如何处理任意分辨率输入:位置编码设计
2026-6-29
多模态模型如何处理任意分辨率输入——Tiling与Packing技术详解(part2)
多模态模型如何处理任意分辨率输入——Tiling与Packing技术详解(part2)
2026-6-29
LocateAnything技术小结
LocateAnything技术小结
2026-6-25
Step by Step: Understanding ROPE
Step by Step: Understanding ROPE
2026-6-3
2023-2026莫叶何竹🍀.
浙ICP备2024065264号

莫叶何竹🍀 | 非淡泊无以明志,非宁静无以致远

Powered byNotionNext 4.10.2.