この研究では、単純な回路を解析するタスクと大規模モデルの特徴を発見するタスクとの間に存在するギャップを埋めることを目的としています。具体的には、テキストからSQLクエリを生成するタスク(Text-to-SQL)を用いて、おもちゃのタスクの形式的構造 ...
この研究では、長い論文を持つ言語モデル(Long-context language models、LCLMs)が、従来の情報検索やデータベース操作などのタスクをどの程度取り込むことができるかを評価することを目的としています。特に、LCLMsが従来の検索システムやRAG(Retrieval-Augmented ...