首页
导航
新闻
学校
热榜
综合
社媒
软件
文献
专题
会员
登录
首页
资讯
导航
热榜
学校
软件
文献
酷应用
新闻
看点
观点
读点
热点
科技
数码
软件
应用
极客
企服
电商
运营
移动
访谈
动态
招聘
访谈
百家
安全
业界
快讯
技术
校园
工具
文娱
明星
影视
音乐
网娱
韩娱
词典
游戏
手游
页游
端游
好货
报道
值得买
健康
最新文章
RedKnot – 小红书开源的长文本推理加速引擎
RedKnot是什么RedKnot 是小红书开源的长文本 LLM 推理加速引擎,将 KV Cache 按注意力头维度解耦,离线分类为需全局重算的全局头与可局部复用的局部头,配合 SegPagedAtt
pigmananal
07-01
阅读:1
赞助链接