因果语言模型在逻辑谜题中的搜索与推理能力
本文研究了因果语言模型在解决数独和斑马谜题中的表现,发现经过逻辑步骤训练的Transformer模型能够高效解决这些复杂任务。
本文研究了因果语言模型在解决数独和斑马谜题中的表现,发现经过逻辑步骤训练的Transformer模型能够高效解决这些复杂任务。
提出RetrievalAttention方法,通过向量检索加速注意力计算,减少推理成本并降低GPU内存需求,适用于长上下文LLM。
提出了一种基于大语言模型的翻译方案,通过预处理、代码分段和迭代编译修复,提高C代码到Rust代码的编译成功率。
本文提出DILA模块,通过稀疏嵌入空间将不可解释的密集嵌入解构成人类可理解的医疗概念,提高解释性和预测性能。
本文比较分析了新兴大型语言模型在代码漏洞检测中的效果,发现CodeGemma在F1得分和召回率上表现最佳。
本文综述了XLM在自动驾驶系统中的潜力,讨论了相关架构、工具和方法,并指出了未来研究方向和挑战。
本文应用UAT理论解释LLM的记忆机制,并提出新方法评估LLM性能,通过实验验证理论并比较LLM与人脑的记忆能力。
提出LLM as BT-planner框架,利用大语言模型生成机器人装配任务的行为树,减少人工设计工作,提高任务规划的成功率和鲁棒性。
本文分析了158个安卓第三方SDK的隐私保护情况,发现338例隐私数据外泄,30%未提供隐私政策,88%虚假声明。
本文研究了CataractBot在24周内的大规模部署,318名患者和陪同人员发送了1992条消息,91.71%的回复由专家验证,医疗问题显著多于后勤问题,系统性能提升了19.02%。