随着ChatGPT在2022年11月底的正式发布,AI工具可以说是正式出现在了大众的视野。随后AI技术开始呈现井喷式的发展,诞生了许多功能各异的AI软件。NVIDIA 作为PC领域的领军者,自然也研究了许多有用的AI工具。先前只能基于NVIDIA RTX的云端服务器使用的Chat With RTX ,目前也已经支持在 Windows RTX PC 或工作站上进行本地部署。这不仅极大地提升了搜索效率,更重要的是,它让用户在处理敏感资料时,无需再将数据上传至第三方或连接至网络,从而确保了用户在使用过程中的安全性。特别是对于耕升 GeForce RTX 40 SUPER系列显卡的用户来说,他们不仅在日常游戏中享受到了流畅的帧数体验,更在使用NVIDIA的AI工具时,感受到了显著的速度提升。
Chat With RTX 促进了用户数据(无论是文档、笔记、视频还是其他形式的内容)与 LLMs 之间的直接连接,增强了其对上下文的理解和个性化。通过检索增强生成(RAG)、TensorRT-LLM 和 RTX 加速,用户可以与定制的聊天机器人交流,快速获取根据其内容定制的答案。同时,用户可以快速轻松地将桌面端上的资料作为数据集,连接到 Mistral 或 Llama 2 这一类开源大型语言模型,以便快速查询与上下文有关的内容。
Chat With RTX支持多种文件格式,包括文本文件、PDF、DOC/DOCX 和 XML,实现了流程的简化。只需在应用程序中指定包含目标文件的文件夹,几秒钟内,应用程序即可将它们加载到库中。
Chat With RTX还支持用户输入视频网站YouTube 播放列表的 URL,使应用程序自动转录视频的内容,以进行查询,进一步丰富了对话体验。相信后续也会进一步支持国内视频网站的使用。
此外,对于开发者而言,Chat With RTX是在 GitHub 上的 TensorRT-LLM RAG 开发者参考项目基础上构建的。开发者可以从这个参考项目中获得灵感,打造和部署适用于 RTX、基于 RAG 的应用,并由 TensorRT-LLM 加速,开启人工智能互动的新时代。
当然,强大的功能也需要优秀的硬件支持。要通过本地部署使用 Chat With RTX,用户需要搭载 GeForce RTX 30 系列或更高版本的 GPU(至少 8GB 显存),并且操作系统需要在 Windows 10 或者 11,并更新至最新的 NVIDIA GPU 驱动。
在此推荐最近发布的耕升GeForce RTX 40 SUPER系列显卡。该系列显卡搭载NVIDIA Ada Lovelace架构,效能较上代显卡有着大幅提升。强大的AI性能能够帮助用户在使用Chat With RTX和Stable Diffusion时提升渲染速度,更快一步获得结果。而在游戏方面支持多项RTX技术,包括NVIDIA DLSS 3.5和光线追踪技术,使游戏画面更加逼真细腻。
其中耕升 GeForce RTX 4070 SUPER星极皓月 OC外壳采用纯白的全金属设计,外观皎洁纯净。再加上全新的三风扇散热器仿佛冰霜般凛冽,为用户呈现出不同寻常的视觉和性能盛宴。对于对电竞游戏、生产力应用和AI创作有高需求的用户来说,这款显卡一定会是一个令人满意的选择。