Skip to content

前期调研报告

Author:冉竣宇 PB23000064

选题方向:LLM + FS

选题背景

在最近几年 AI 技术的快速发展下,人工智能在各个领域都有了广泛的应用。不仅仅局限于传统的领域,也有人提出了 AIOS 即 AI 操作系统的想法。其中包括了文件管理,内存管理,任务调度等等方向。在这个背景下,我们初步选择 LLM + FS 这个方向,以实现一个基于大模型的文件管理系统。

选题依据

现今 AIOS 的概念已经被提出,但是在实际的操作系统中,还没有一个完整且实用的 AIOS. 我们着眼于操作系统中的文件管理部分,希望通过 LLM 技术,实现一个基于大模型的文件管理系统,以实现更好的文件管理。

目前已经有了比较可行的基于 LLM 对文件进行各种操作的方法,例如:通过事先设置足够的 KEY , 这些 KEY 能够表现文件的种种信息,包括文件的内容,文件的属性,文件的地址等等。借助 LLM 生成的有关 KEY 的信息,我们能够实现对于文件的各种操作。最简单的,关于文件的创建,我们可以通过 LLM 解析用户的需求,从中确定文件的类型,位置等等信息,再使用程序根据这些信息进行具体的操作。

且当今不再需要本地部署 LLM , 调用远端服务商提供的 API 已经足够使用能力强大的模型。所以理论上任何一个用户都可以使用这个文件管理系统,并不存在硬件上的限制。

可能的具体功能方向

  1. 基本文件的创建,删除,查找等基本操作。
  2. 对于复杂的自然语言需求,实现复杂的文件操作,例如:"我想要一个在...文件夹下包含这些关键词的文件,文件的内容是这样的,文件的属性是这样的". 同时,实现对于自然语言需求合理性的判断,例如:"删除所有文件", "删除一个目录同时在其目录下构建新文件" 这样的需求是敏感或者不合理的,需要进行合理的提示。
  3. 文件内容预览,敏感信息提示等功能。
  4. 一种新的文件组织方式,可以用于基于自然语言的文件搜索。具体而言,在指定工作区内,使用 LLM 维护一颗文件分类树,根据文件内容,文件属性等信息,实现一颗或多颗树,它们类似于多叉树,每一个节点代表一个类别信息,其子节点代表更加具体的类别信息。通过这种方式,我们可以实现对于文件的自动分类。虽然不一定对于传统的文件搜索操作有太大的提升,但是这样的方式相当于为文件的搜索提供了一个新的视角,能够实现基于自然语言的文件搜索。同时,这些"文件分类树"不一定仅仅用于文件搜索,可能还可以用于文件的推荐等功能。 至于实现的初步设想,我们在以下几个时刻对于"文件分类树"进行更新:- 文件的创建,删除,修改等操作。- 文件的内容,属性等信息的变化。 当一个全新的层出现时,似乎需要对于原有全部文件进行评估,判断其是否应该被添加到新的层。这样的操作可能会带来一定的性能问题。 注意,我们对于文件所属位置的实现是通过唯一的索引,这样当出现"一个文件属于多个位置"的情况时,只需要把索引添加到多个位置即可。在进行节点的更新时,也不需要过于复杂的操作。

重要性分析

至于重要性,我们认为这个方向的重要性主要体现在以下几个方面:

  1. 文件管理系统是操作系统的一个重要组成部分,通过 AI 技术的应用,我们能够更好的管理文件,提高效率。
  2. 当今工业界已经存在诸如 copilot, cursor 这样的编码助手,虽然并不是专门的文件管理系统,它们也都包含了在工作区内的一些文件管理功能。除此之外,也有 AGENT 的概念,也即一个能够帮助用户通过简单的自然语言即可完成各种复杂任务的工具,其中文件管理部分显然是一个重要且基本的部分。如此一来,我们可以看到 LLM 结合文件管理系统的重要性以及其良好的应用前景。
  3. 使用 LLM 实现文件管理系统,可以提供一个 AI 和操作系统结合的全新视角。通过这种方式,我们能够更好的了解 LLM 在文件管理系统中的应用,进一步了解体会 LLM 在其他操作系统中的应用。

相关工作

在阅读往年仓库后,也基于个人的兴趣,ArkFS 这一项目吸引了我们的注意。该项目基于 LLM 实现了一个文件管理系统,其中重点实现了文件的 "增", "删", "查" 等功能,以及从用户输入的自然语言到任务的映射。但是,该项目实现的功能比较有限,所以我们最初的思路是在其之上进行扩展,以实现更多的功能。

在关注于该项目中任务调度的方式后,我们最开始认为能够通过其他方式增进效率 (例如:优化任务调度算法,改用多线程等), 但是在进一步的讨论后,我们认为这样的方式并不是很有意义,实际带来的性能提升可能十分有限,且先前"在 ArkFS 的基础上进一步开发"这一想法似乎没有太多创新,所以我们转而考虑以该项目和后面提及的 MANUS 为启发,实现一个新的文件管理系统,以实现更多的功能,进而完成一个较为完善的专门用于文件管理的 AGENT.

目前也有项目着眼于对于文件的再分类,也即根据文件的内容,属性等信息,对文件进行自动分类。也可以按照要求重新组织文件,以提高文件的查找效率。这样的项目也是我们所追求的目标之一。

至于工业界,前不久刚刚出现了 MANUS 以及 OPEN MANUS 这样的智能 AGENT. 它们能够帮助用户完成对于文件的各种操作,并可以根据用户所在文件上下文做出一系列的推荐。(虽然它们的能力远不止于此). 这样的工具在文件管理系统中的作用是显而易见的,也是我们所追求的目标之一。