AI真的可以像人类一样“看到”并形成“回忆”吗?现在,这个想法逐渐成为现实。这一创新的进步是由28岁的肖恩·沉(Sean Shen)创立的硅谷初创公司(Sean Shen)创立的。该公司最近推出了世界上第一个大型视觉记忆模型(LVMM,大型视觉记忆模型)。它可以长期存储大型视觉信息,快速搜索和详细的推断,从而提高了进步。这项技术已在许多领域(例如安全,个性化助手和媒体创建)应用。根据该公司的说法,“我们甚至可以达到非常精确的速度,毫秒的理解”,机器感到理解人类世界的基础,并以持续的学习能力建立共同的人工智能。值得注意的是,Shen Junxiao的学术和专业背景也为这一技术进步提供了坚实的Soporte。从英国高中毕业后,他获得了一项完整的奖学金,并在英国剑桥大学招收,获得了他不断的本科,精通和博士学位。后来,他曾在Metallineaness Lab担任研究科学家,在虚拟和增强现实领域积累了许多前卫的经历。他目前是英国布里斯托尔大学的助理教授,并继续促进视觉计算机科学和人工智能领域的共同研究。这两张照片分为不同的维度。一个人聪明但健忘或出色,但推理技能有限。目前,该行业和学院都主要致力于提高人工智能智能水平,但是对AI的长期记忆机制的系统研究遵循了Siendor不足。一些公司已经开始进入该领域,但是大多数公司仅限于文本级别的上下文工程,并且具有NOT尚未穿透更重要的视觉记忆体系结构。在沉Junxiao的看来,单词本质上不能构成真实的记忆,并且与短期背景更相似。这种形式可以支持程序记忆,但是很难以真正的人类意义带来长期的记忆:情节记忆。他以一个例子解释。 “一个吃汉堡包的人的最新记忆出现在他的脑海中,例如汉堡包的外观,而不是文字描述,例如“我吃了汉堡包。 “因此,AI长期记忆的构建应该更多地集中在引入视觉记忆机制上,而不仅仅是留在TheText级别。受人体记忆结构,记忆的启发。内存处理体系结构可以准确地分析用户的意图,准确地查找并提取视觉中继记忆片段,使所有相关的视觉信息基于当前的视觉信息,并根据用户的目前咨询来确定内容OO,并根据用户的当前内容O o o ose of the Contern Chemporence otection o o。f此内存。 LVMM的特征取决于视频搜索,但核不仅如此。了解基本的10小时视频和1小时视频技术可能相似,但是它必须实现基本创新,包括数据库的设计,算法优化和算法优化,包括获得数据库设计,算法优化和数百万。 Gemini 2.5 Pro可以达到1小时,而LVMM几乎是无限的视觉记忆。一个典型的案例是Seriestelevision“我是刑事警察”的情节,警察动员了数百人,并整夜筛选了监视视频以追踪嫌疑人。借助LVMM系统,类似的任务可以自动显示通过AI的目标剪辑并快速找到它们,从而使您可以跟踪从童年到成年的角色,从而大大提高效率。 Shen Junxiao还指出:“危险的定义因一个地区而异。例如,判断在美国不同州的同样行为可能完全不同。系统必须信任长期学习以了解情景的这些特征。多模式的记忆能力已成为清晰的技术说明之一。g大量的历史视频材料与其他多模式数据集成在一起,以支持最有效的搜索和问题和答案的技能。长期视觉记忆在相册和应用程序专辑video管理离子中也很重要。据报道,Memories.ai正在与三星合作实施LVMM以结束手机。具有“记忆”意味着自然语言的特定细分市场可以精确地恢复,并具有成千上万的照片和视频。对于视频创建者,系统可以构建专用的视频搜索引擎和文档引擎,该引擎允许快速自动版本。此外,您还可以根据在线视频进行宏观趋势分析。人工智能可以使用它来确定内容的普及方法,原因和内容的流行,从而引用了创建和决策的参考。从长期的角度来看,这项技术建立了建立人造Inte基本视觉记忆层的重要基础lligence。可以跟踪生活细节的AI助手,是通过观察世界来学习的类人类机器人,Vidrior智能或便携式设备,或者具有真正视觉理解能力的下一个智能系统,是基于连续,稳定且稳定且高效的视觉记忆机制。 “ am aroral”:出生于江苏省的诺吉玛,从14岁的高中至硅谷山朱朱朱诺商人开始。他始终坚持这样一种信念,即“选择大于努力”,由于许多“非凡”选择,他的生活轨迹也是独一无二的。他的第一个重要选择是从城市的小学转移到城市的高中,但他没有停下来,并且一直想去“伟大的世界”。尽管他的中学入学考试取得了出色的成绩,但14岁 – 戈德还是去了英国,并在中学出国学习,只有两个完整的学者该国的船只。在剑桥大学,沉胡克亚奥(Shen Hookiao)完成了他完整的本科研究。博士研究的重点是基于光学透视领域的自动学习和组装设计的用户来开发用户互动相互作用的推理模型。它应用于可视化场景,并在教师Oracrystenson和Bilburn下进行了研究。在此期间,人工智能技术的快速发展使他能够看到一条现实的途径,以实现“通过技术提高人类效率”的愿景。从博士学位毕业后,沉Junxiao加入了现实实验室的目标,作为研究科学家。在这个职位上,他主要致力于与时间序列分析密切相关的科学研究。他说:“我以前曾从事过许多关于手势理解的研究。手势识别的性质也是时间序列的问题。要么识别手势,要么这些研究地址在方法论上是一致的,这些研究地址是一致的。 “当大多数公司专注于提高AI的“智力能力”时,它选择了一个差异化的研究地址,侧重于构建AI的“记忆”能力。但是,在尚未划分人工智能领域的科学问题中,人工智能尚未划分人工术语,尤其是在有效地使用结构化的存储和大型信息信息。观点,团队正在努力平衡“生物合理性”(与人类记忆的相似性)和“工程绩效”(解决问题的有效性)。X认知任务。正如神经元网络并不能完全复制人脑,但他们在两者之间找到了有效的平衡,而深圳小及其团队则使用人类记忆机制来促进记忆研究,而不是追求单个机器的分配,我们将建立一个目前正在使用的AI内存系统。这清楚地说明了沉·甘基亚奥(Shen Gankiao)在Arxiv Pre -Optest网站上发表的一篇文章。相关文档的标题为“人类灵感的观点:对AI的长期记忆调查” [1]。从人类记忆机制开始,这项研究研究了长期记忆存储,AI机制的恢复和遗忘,并提出了一种基于记忆(PALM)的新认知结构(PALM),该结构适用于人类记忆理论,为AI系统的未来设计提供了理论基础。图|相关文件(来源:ARXIV)乔弗里·欣顿(Geoffrey Hinton)物理学的诺贝尔奖获得者开了“记忆重建”的概念。这意味着每种提取物(而不是静态存储)会动态重建内存。 Shen Junxiao的团队将内存作为结构化表示形式处理,并实现了回顾性层次重建,以模拟人类记忆的灵活性和适应性。该研究还基于长期人类记忆的经典“三点模型”,在情节,语义和过程记忆中划分了长期的人类记忆。具体而言,情节记忆是对特定事件的记忆,例如“上周领导我的离开”。语义记忆是对事实和概念的记忆,例如“汽车有四个轮子,自行车有两个轮子”。过程记忆是对技能和习惯的记忆,例如“我如何学会开车”。 (来源:ARXIV)在另一项研究[2]中,Shen Junxiao还讨论了其合作者以及记忆改进技术的现有局限斑点。在他们的研究过程中,他们发现改善内存的现有技术会导致一些不便,例如,可以根据标签搜索当前的技术,但不能实施基于语义的语义语义和答案和答案。这限制了复杂场景的内存改进技术,因为语义搜索使您可以更好地理解和响应咨询需求。根据这些发现,团队将对长期视频的理解视为更具创新性的研究地址。他们确定基于初始观点的视频数据将在未来成为主要的中流台,因此,相关技术开始促进实施和早期探索,这使系统能够在长期视频中获得结构化的理解和对高复杂性的语义搜索。通过这些任务,团队建议通过引入内存Vlong -Term提高AI系统的能力是自动的,并在理论构建和技术实践之间建立了闭路电路。他们认为,通过超过语义,适应和重建功能的现有内存模型的缺点,可以打开真正配备有可持续学习和进化能力的新途径。正是由于这些问题,沉Junxiao决定在2024年迅速采取行动。此外,目前,Memories.ai已经完成了由Susa Ventures执导的800万美元种子轮的融资,其次是被称为Samsung Ventures and Fusion Fund的机构。照片| Shen Junxiao和Ben(Enmin)Zhou(右)(来源:Memories.ai)Shen Junxiao认为AI技术将可靠地重建Hardwarenales的未来形式。信任中央大型视频理解技术由回忆开发的,该公司将与一家重要的国家硬件公司合作推出T他的露西别针。如今,Memories.ai正在积极促进与便携式设备深入集成的中央硬件的研究和开发。该设备旨在全天记录用户生活的图像,捕获人类的视觉记忆,并有效地将其转换为可用于AI的视觉记忆系统。 Shen Gankiao说:“我们希望对AI的长期视觉记忆在将来变得更加精确,更快,并在更多的行业中广泛使用。”参考:1.https://arxiv.org/abs/2411.004892.j。 SHEN, J. J. Dudley, P. O. Kristesson, Code-Store-Retrieve: Increased human memory through Word coded egocentric recognition, 2024 IEEE International Symposium onMixed and augmented reality (ISMAR), Bellevue, WA, USA, 2024, pp. 923-931, DOI: 10.1109/ISMAR6208.2024.00108.3.https: //shawnshenjx.github.io/4.https://memories.ai/blog/loge-visual-memory-model
特殊声明:先前的内容(包括照片和视频,如果有)由网络自我媒体平台的用户收取和发布。该平台仅提供信息存储服务。
注意:以前的内容(如果您有照片或视频)将由社交媒体平台NetEase Hao的用户收取和发布,仅提供信息存储服务。