20 个 AI 概念

  1. 机器学习:核心算法、统计和模型训练技术
  2. 深度学习:分层神经网络自动学习复杂表示
  3. 神经网络:分层架构高效准确模拟非线性关系
  4. NLP:处理和理解自然语言文本的技术
  5. 计算机视觉:解释和分析视觉数据的算法
  6. 强化学习:跨多个服务器分布流量以提高可靠性
  7. 生成模型:使用学习数据创建新数据样本
  8. LLM:使用大规模预训练数据生成类人文本
  9. Transformers:基于自注意力架构支持现代 AI 模型
  10. 特征工程:设计信息丰富特征显著提高模型性能
  11. 监督学习:从无标签数据学习有用表示
  12. 贝叶斯学习:使用概率模型方法结合不确定性
  13. 提示工程:精心制作有效输入指导生成模型输出
  14. AI Agent:感知、决策和行动的自主系统
  15. 微调模型:为领域特定任务定制预训练模型
  16. 多模态模型:跨多种数据类型(如图像、视频和文本)处理和生成
  17. 嵌入:将输入转换为机器可读向量格式
  18. 向量搜索:使用密集向量嵌入查找相似项
  19. 模型评估:使用验证技术评估预测性能
  20. AI 基础设施:部署可扩展系统支持 AI 操作

构建 RAG 应用的 AI 应用栈

大型语言模型

这些是检索增强生成(RAG)的核心引擎,负责理解查询并生成连贯和上下文响应。一些常见 LLM 选项是 OpenAI GPT 模型、Llama、Claude、Gemini、Mistral、DeepSeek、Qwen 2.5、Gemma 等。

框架和模型访问

这些工具通过处理提示编排、模型切换、记忆、链接和路由简化 LLM 集成到应用中。常见工具是 Langchain、LlamaIndex、Haystack、Ollama、Hugging Face 和 OpenRouter。

数据库

RAG 应用依赖存储和检索相关信息。这些向量数据库针对相似性搜索优化,而关系选项如 Postgres 提供结构化存储。工具是 Postgres、FAISS、Milvus、pgVector、Weaviate、Pinecone、Chroma 等。

数据提取

填充知识库,这些工具帮助从非结构化源(如 PDF、网站和 API)提取结构化信息。一些常见工具是 Llamaparse、Docking、Megaparser、Firecrawl、ScrapeGraph AI、Document AI 和 Claude API。

文本嵌入

嵌入将文本转换为高维向量,实现语义相似性搜索,这是在 RAG 中连接查询与相关上下文的关键步骤。常见工具是 Nomic、OpenAI、Cognita、Gemini、LLMWare、Cohere、JinaAI 和 Ollama。

Shopify 技术栈

Shopify 处理大多数系统会崩溃的规模。

在单日(2024 年黑色星期五),平台处理 1730 亿请求,峰值每分钟 2.84 亿请求,并通过其边缘每分钟推送 12TB 流量。

这些数字不是异常。它们是 Shopify 努力满足的持续目标。在这个规模背后是外表欺骗简单的技术栈:Ruby on Rails、React、MySQL 和 Kafka。

但这种简单隐藏尖锐架构决策、多年重构和数千 deliberate 权衡。

在这个通讯中,我们映射 Shopify 的技术栈从:

  • 仍然运行业务的模块化单体
  • 到隔离失败域的 pod
  • 到每天部署数百更改的部署管道

它涵盖 Shopify 使用的工具、编程语言和模式,以保持快速、弹性且开发者友好在难以置信的规模。

本文为学习目的的个人翻译,译文仅供参考。

原文链接:EP167: Top 20 AI Concepts You Should Know

版权归原作者或原刊登方所有。本文为非官方译本;如有不妥,请联系删除。