The Connector 周刊#19:在 AI 时代,如何用新工具来扩展大脑思维与记忆的边界?

The Connector 每周会选取我从信息流里获取的有价值内容,包括 AI 探索专题、Github 开源库推荐、工具介绍和一些文章书籍等,目标是链接互联网上的优质内容,获得更多的灵感和知识,从而激发彼此的创造力。

我的新书《LangChain编程从入门到实践》 已经开售!推荐正在学习AI应用开发的朋友购买阅读!
LangChain编程从入门到实践

AI 探索

  1. LLM 技术图谱:将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。
  2. 开源AI的最新进展:开源AI代表着隐私和数据所有权的未来,为了实现这一目标,需要进行大量的创新。在过去的一年里,开源社区已经展示了他们为把高质量的模型交到消费者手上而付出的努力,并在不同的人工智能领域已经创造了一些重大创新。如果你没有时间或者没有渠道了解AI的发展动态,你适合收藏这本电子书,实时更新最新AI技术动态,内容齐全,包括模型、微调、向量数据库等多方面的内容。
  3. 关于多模态和多模态大模型的介绍:文章内容很全面,介绍了多模态的方方面面。

开源推荐

  1. distil-whisper:是由Hugging Face团队开发,它在Whisper核心功能的基础上进行了优化和简化,体积缩小了50%。速度提高了6倍。并且在分布外评估集上的字错误率 (WER) 不超过 1%。主要优点:Distil-Whisper 的推理速度是 Whisper 的 6 倍;模型大小减少了 49%,更适合资源有限的设备;词错误率(WER)与 Whisper 相比只有 1% 的差距;在嘈杂环境下仍能保持较高的识别准确性;减少了重复词组的出现,并降低了插入错误率;作为 Whisper 的辅助模型,推理速度提高了 2 倍。
  2. pydeps:Python模块依赖可视化工具。
  3. Umi-OCR:免费开源的OCR软件,离线使用,速度超快,支持批量识别,还可以指定识别区域。

工程师工具

  1. Rath:是数据分析和可视化工具(如 Tableau)的开源替代品,主要功能包括:支持主流数据库导入;自动生成多维数据并可视化;自动发现数据规律,揭示数据的内在联系和因果关系;因果发现与推断,帮你挖掘更深层次的变量关系;根据你关心的文本片段,自动理解你想要进行的数据转化操作,并帮你生成转化选项;使用增强分析引擎自动化你的探索性数据分析(EDA)流程;数据绘板,使用绘画的方式玩数据分析。
  2. Komiser:开源云环境资产管理器,提供一个与云无关的平台,在一个地方来管理所有这些复杂性,使下一代开发人员能够构建应用程序,而无需担心隐藏成本、安全问题或孤立资源。Komiser 的资源依赖图旨在突出显示易受攻击资源的潜在攻击路径。发现闲置、未充分利用和未标记的资源。
  3. Localpilot:一键在MacBook上本地运行GitHub Copilot 用户只需要进行简单的设置和安装步骤,就可以在本地(即自己的Macbook上)运行GitHub Copilot,并且可以在没有网络连接的情况下使用。

值得一看

  1. Instagram如何在仅有3名工程师的情况下扩大到1400万用户数:Instagram 仅仅用一年多的时间就从零用户增长到了 1400 万用户,这得益于它遵循了三个关键原则并使用了可靠的技术架构。该应用程序的前端采用 Objective-C 和 UIKit 进行编写,而后端则使用 Django 和 Python,并使用 Gunicorn 作为 WSGI 服务器。基础设施运行在 AWS 上,使用 EC2 进行虚拟计算机和 Elastic Load Balancer 进行负载均衡。数据存储采用了 Postgres,使用分片和可按时间排序的 ID 进行存储。照片存储由 Amazon S3 和 CloudFront 处理,缓存则使用 Redis 和 Memcached。 Postgres 和 Redis 使用 Amazon EBS 进行主从配置备份。推送通知使用 pyapns 发送,并使用 Gearman 管理异步任务。监控工作使用 Sentry、Munin、Pingdom 和 PagerDuty 完成。
  2. 构建外脑 / 智变时代的个人知识管理:本文探讨了在新一轮AI变革中,利用新工具帮助扩展大脑思维与记忆边界的方法,以及构建外脑的新方式。通过大语言模型的使用和数字化工具的发展,可以创建一个外部的数字化集中方式,存储关注的信息和所学到的东西。而且,通过使用语言模型和数字笔记工具,可以激发创造力和创建想法之间的连接。可以使用CODE方法来帮助组织信息,包括捕获、组织、提炼和表达四个步骤。而在构建外脑时,可以使用Apple Notes、Mymind、Notion和Google Drive等工具来帮助记忆、理解和创造。未来,可以期待更多智能化的工具来帮助构建外脑。
  3. 创业墓地:不要只是从成功的案例中找方法,更要从失败的案例中避坑,这个创业墓地收集并采访了 120 多个失败的案例, 每一篇都有过来人的血泪的经历的分享,或许对你做产品更有帮助。
  4. 手把手教你阅读开源代码:阅读开源代码的方法论总结:开始之前要看官方文档,了解开源项目的背景、功能和优势;熟悉代码目录结构,从示例代码入手;可以观看相关视频或PPT获取更直观的理解;了解构建脚本,如CMake或Makefile;安装部署并运行程序,获取直观感受;阅读简单的例子代码来熟悉项目的主干和核心模块;记录心中疑惑,带着问题阅读源代码;画图梳理源代码逻辑,添加日志和调试;写笔记记录想法,促进思考和总结;可以抄写项目源代码,仿写相近的程序进行操练;最后,将所学知识输出给他人,用以检验自己的掌握程度。

The Connector 周刊#19:在 AI 时代,如何用新工具来扩展大脑思维与记忆的边界?

https://liduos.com/the-connector-weekly-19.html

作者

莫尔索

发布于

2023-11-05

更新于

2024-05-19

许可协议

评论