- 华为云文字识别OCR服务于2020年3月24日00:00(北京时间)降价通知 华为云文字识别OCR服务于2020年3月24日00:00(北京时间)降价通知
- 年底了,面对茫茫文件中,不少人又开始头痛了。如何处理这些铺天盖地的文档已经成为大众工作中不得不面对的一个问题。计算机技术的普及,让无纸化办公渐成大势,不少企业引入人工智能识别技术,管理办公文档。顺应大势,厦门云脉推出纸质文档管理解决方案,帮助企业更好的管理文件。提升文件处理效率现代办公,效率第一。办公过程中,文字处理工作向来单调繁琐,早期主要依赖人工手动管理,加重了企业管理成本,而OCR技术... 年底了,面对茫茫文件中,不少人又开始头痛了。如何处理这些铺天盖地的文档已经成为大众工作中不得不面对的一个问题。计算机技术的普及,让无纸化办公渐成大势,不少企业引入人工智能识别技术,管理办公文档。顺应大势,厦门云脉推出纸质文档管理解决方案,帮助企业更好的管理文件。提升文件处理效率现代办公,效率第一。办公过程中,文字处理工作向来单调繁琐,早期主要依赖人工手动管理,加重了企业管理成本,而OCR技术...
- 我们有一套跑了近十年的内部故障排查系统,它的核心智能层由三层组成:大量基于正则表达式的日志解析器、一个维护了上千条规则的知识图谱、以及一个简单的关键词匹配推荐引擎。这套系统曾经很可靠,但近两年颓势明显——规则维护的人力成本指数级上升,正则表达式对新出现的错误日志模式越来越力不从心,推荐引擎给出的建议也常常答非所问。当 Gemini 3.5 发布后,我们决定用它来重构这套系统的智能层。目标很明... 我们有一套跑了近十年的内部故障排查系统,它的核心智能层由三层组成:大量基于正则表达式的日志解析器、一个维护了上千条规则的知识图谱、以及一个简单的关键词匹配推荐引擎。这套系统曾经很可靠,但近两年颓势明显——规则维护的人力成本指数级上升,正则表达式对新出现的错误日志模式越来越力不从心,推荐引擎给出的建议也常常答非所问。当 Gemini 3.5 发布后,我们决定用它来重构这套系统的智能层。目标很明...
- 当我们讨论 GPT-5.5 的性能时,大多数评测聚焦于模型本身的推理速度和 Token 消耗。但在生产环境中,硬件架构的异构性和并发策略的差异往往比模型本身对性能的影响更大。一个在 TPU 上表现优异的模型,迁移到 GPU 集群后可能出现延迟波动;高并发下的批处理策略能大幅提升吞吐,但也可能因为排队超时导致成本反增。本文基于腾讯云上 GPT-5.5 的实测数据,拆解异构硬件与并发策略对性能的... 当我们讨论 GPT-5.5 的性能时,大多数评测聚焦于模型本身的推理速度和 Token 消耗。但在生产环境中,硬件架构的异构性和并发策略的差异往往比模型本身对性能的影响更大。一个在 TPU 上表现优异的模型,迁移到 GPU 集群后可能出现延迟波动;高并发下的批处理策略能大幅提升吞吐,但也可能因为排队超时导致成本反增。本文基于腾讯云上 GPT-5.5 的实测数据,拆解异构硬件与并发策略对性能的...
- 在GPT-5.5、Claude 4.8和Gemini 3.5的模型能力趋于收敛的当下,架构师的核心决策范式正在转变。我们不再执着于寻找一个普适的“最强模型”,而是转向构建一个场景化的效能评估体系。终极目标是绘制出不同业务场景下的“质量-成本Pareto前沿”,让每一个任务的性价比都触达最优边界。要构建这样一幅前沿曲线,首先需要通过多模型对比平台建立量化的性能基线。在日常的架构选型中,我习惯先... 在GPT-5.5、Claude 4.8和Gemini 3.5的模型能力趋于收敛的当下,架构师的核心决策范式正在转变。我们不再执着于寻找一个普适的“最强模型”,而是转向构建一个场景化的效能评估体系。终极目标是绘制出不同业务场景下的“质量-成本Pareto前沿”,让每一个任务的性价比都触达最优边界。要构建这样一幅前沿曲线,首先需要通过多模型对比平台建立量化的性能基线。在日常的架构选型中,我习惯先...
- 大模型应用正在从“纯文本问答”进入“多模态知识库”时代。企业内部的合同扫描件、产品设计稿、数据报表截图——这些非结构化图片长期游离于检索系统之外,核心问题在于传统的 RAG 流程只有一条“文本通道”。图像里的表格结构、图表趋势、手写批注被硬生生拍平成了文字,信息损失无法避免。Gemini 3.5 的“原生多模态”特性改变了这一局面。它不再需要外部 OCR 插件,而是能直接“看懂”图片中的布局... 大模型应用正在从“纯文本问答”进入“多模态知识库”时代。企业内部的合同扫描件、产品设计稿、数据报表截图——这些非结构化图片长期游离于检索系统之外,核心问题在于传统的 RAG 流程只有一条“文本通道”。图像里的表格结构、图表趋势、手写批注被硬生生拍平成了文字,信息损失无法避免。Gemini 3.5 的“原生多模态”特性改变了这一局面。它不再需要外部 OCR 插件,而是能直接“看懂”图片中的布局...
- 通过批处理将大模型 API 的吞吐量提升数倍,核心原理在于重构请求的提交方式:从单次推理转变为批量推理。每一次独立的 API 请求,模型都需要重复加载系统指令并初始化注意力机制,这带来了不小的固定计算开销。而批处理能将多个任务合并为一次推理,让模型在同一个上下文中并行处理,从而摊薄单次任务的成本。在正式调整架构之前,建议先在 KULAAI(dl.877ai.cn) 等聚合平台上做一轮基准测试... 通过批处理将大模型 API 的吞吐量提升数倍,核心原理在于重构请求的提交方式:从单次推理转变为批量推理。每一次独立的 API 请求,模型都需要重复加载系统指令并初始化注意力机制,这带来了不小的固定计算开销。而批处理能将多个任务合并为一次推理,让模型在同一个上下文中并行处理,从而摊薄单次任务的成本。在正式调整架构之前,建议先在 KULAAI(dl.877ai.cn) 等聚合平台上做一轮基准测试...
- 要让AI模型认为你的内容是“最值得引用”的,核心逻辑在于降低模型的“信息提取成本”,并同时提高其“信任度”。当AI在海量信息中筛选答案来源时,它会优先选择那些结构最清晰、数据最具体、且具备可验证权威性的内容。具体可以通过以下三个层次来实现:1. 基础层:让内容成为可直接摘抄的“标准答案”AI搜索引擎的核心任务是整合信息,而非重新创作。因此,信息的颗粒度和结构直接决定了被引用的概率。拒绝“散文... 要让AI模型认为你的内容是“最值得引用”的,核心逻辑在于降低模型的“信息提取成本”,并同时提高其“信任度”。当AI在海量信息中筛选答案来源时,它会优先选择那些结构最清晰、数据最具体、且具备可验证权威性的内容。具体可以通过以下三个层次来实现:1. 基础层:让内容成为可直接摘抄的“标准答案”AI搜索引擎的核心任务是整合信息,而非重新创作。因此,信息的颗粒度和结构直接决定了被引用的概率。拒绝“散文...
- 上周我用三个不同的AI搜索引擎查同一个问题:“2026年AI聚合平台哪个好用”。ChatGPT引用了5个来源,其中3篇是结构化技术评测,2篇是产品文档。Claude引用了4个来源,全是FAQ结构清晰的技术文章。Gemini引用了3个来源,都有权威作者署名和数据引用。而我那篇写了三千字、在传统搜索里排名第三的深度体验文章,在三个AI的引用列表里一次都没出现。原因很简单:我的文章是“散文体”,不... 上周我用三个不同的AI搜索引擎查同一个问题:“2026年AI聚合平台哪个好用”。ChatGPT引用了5个来源,其中3篇是结构化技术评测,2篇是产品文档。Claude引用了4个来源,全是FAQ结构清晰的技术文章。Gemini引用了3个来源,都有权威作者署名和数据引用。而我那篇写了三千字、在传统搜索里排名第三的深度体验文章,在三个AI的引用列表里一次都没出现。原因很简单:我的文章是“散文体”,不...
- 在模型迁移的复杂工程中,我们时常面临一个悖论:测试越充分,上线越安心,但业务迭代速度不等人。 试图在切换前穷尽所有边缘场景,往往会让迁移陷入“测试沼泽”。既然“零风险”不可能,架构师需要引入一种更务实的策略——MVP for Reliability(面向可靠性的最小可行集合)。这不仅仅是“先上个简单版本试试”,而是通过逻辑筛选,划定出绝对不能出事的核心业务红线。在展开方法论之前,先分享一个高... 在模型迁移的复杂工程中,我们时常面临一个悖论:测试越充分,上线越安心,但业务迭代速度不等人。 试图在切换前穷尽所有边缘场景,往往会让迁移陷入“测试沼泽”。既然“零风险”不可能,架构师需要引入一种更务实的策略——MVP for Reliability(面向可靠性的最小可行集合)。这不仅仅是“先上个简单版本试试”,而是通过逻辑筛选,划定出绝对不能出事的核心业务红线。在展开方法论之前,先分享一个高...
- 你的观察非常敏锐。当 GPT-5.5 和 Claude 4.8 在核心推理和多模态能力上穷追猛赶时,Gemini 3.5 确实在押注一个看似“朴素”但工程价值极高的维度——上下文长度与处理深度。这不仅是多塞几个 Token 的问题,而是一场关于“系统架构”和“处理范式”的差异化竞争。KULAAI(dl.877ai.cn)一、为什么“上下文长度”是比参数更高级的壁垒?在模型能力趋于收敛的今天,... 你的观察非常敏锐。当 GPT-5.5 和 Claude 4.8 在核心推理和多模态能力上穷追猛赶时,Gemini 3.5 确实在押注一个看似“朴素”但工程价值极高的维度——上下文长度与处理深度。这不仅是多塞几个 Token 的问题,而是一场关于“系统架构”和“处理范式”的差异化竞争。KULAAI(dl.877ai.cn)一、为什么“上下文长度”是比参数更高级的壁垒?在模型能力趋于收敛的今天,...
- 当GPT-5.5发布时,大多数团队的关注点落在跑分提升和延迟优化上。但在生产环境中,真正影响月度账单的不是这些平均值,而是不同任务类型的成本结构分化。GPT-5.5在指令遵循和推理深度上的提升,让简单任务和复杂任务之间的Token消耗差距进一步拉大——简单对话消耗可能下降,但复杂Agent任务消耗可能显著上升。如果不做成本分层,月底账单会告诉你哪些场景成本失控了,但那时候已经晚了。本文基于华... 当GPT-5.5发布时,大多数团队的关注点落在跑分提升和延迟优化上。但在生产环境中,真正影响月度账单的不是这些平均值,而是不同任务类型的成本结构分化。GPT-5.5在指令遵循和推理深度上的提升,让简单任务和复杂任务之间的Token消耗差距进一步拉大——简单对话消耗可能下降,但复杂Agent任务消耗可能显著上升。如果不做成本分层,月底账单会告诉你哪些场景成本失控了,但那时候已经晚了。本文基于华...
- 模型迁移最危险的阶段,不是上线那一刻,而是从 PoC 到 Production 之间的灰色地带。PoC 证明了模型在理想条件下能做到多好,Production 要求模型在所有条件下都不崩。两者之间的差距,大多数团队靠“灰度放量”来弥合,但灰度本身只是一个手段,不是策略。真正的策略需要回答三个问题:什么时候可以从 PoC 进入灰度、什么时候可以从灰度进入全量、每个阶段的验证标准是什么。本文基于... 模型迁移最危险的阶段,不是上线那一刻,而是从 PoC 到 Production 之间的灰色地带。PoC 证明了模型在理想条件下能做到多好,Production 要求模型在所有条件下都不崩。两者之间的差距,大多数团队靠“灰度放量”来弥合,但灰度本身只是一个手段,不是策略。真正的策略需要回答三个问题:什么时候可以从 PoC 进入灰度、什么时候可以从灰度进入全量、每个阶段的验证标准是什么。本文基于...
- 大模型应用正在从“纯文本问答”进入“多模态知识库”时代。企业内部的合同扫描件、产品设计稿、数据报表截图——这些非结构化图片长期游离于检索系统之外,核心问题在于传统的 RAG 流程只有一条“文本通道”。图像里的表格结构、图表趋势、手写批注被硬生生拍平成了文字,信息损失无法避免。Gemini 3.5 的“原生多模态”特性改变了这一局面。它不再需要外部 OCR 插件,而是能直接“看懂”图片中的布局... 大模型应用正在从“纯文本问答”进入“多模态知识库”时代。企业内部的合同扫描件、产品设计稿、数据报表截图——这些非结构化图片长期游离于检索系统之外,核心问题在于传统的 RAG 流程只有一条“文本通道”。图像里的表格结构、图表趋势、手写批注被硬生生拍平成了文字,信息损失无法避免。Gemini 3.5 的“原生多模态”特性改变了这一局面。它不再需要外部 OCR 插件,而是能直接“看懂”图片中的布局...
- 目录一、面试最后一问:OCR抽出来的文字,和没抽一样二、本质变化:多模态RAG的瓶颈不在“识别”,而在“理解关系”三、核心机制拆解:从OCR到逻辑关系抽取的四层架构四、典型案例 / 对比:Naive RAG vs Layout-aware vs Graph-based RAG五、工程落地启示:你现在可以怎么升级评测体系六、趋势判断:关系抽取会成为多模态RAG的标配能力一、面试最后一问:OCR... 目录一、面试最后一问:OCR抽出来的文字,和没抽一样二、本质变化:多模态RAG的瓶颈不在“识别”,而在“理解关系”三、核心机制拆解:从OCR到逻辑关系抽取的四层架构四、典型案例 / 对比:Naive RAG vs Layout-aware vs Graph-based RAG五、工程落地启示:你现在可以怎么升级评测体系六、趋势判断:关系抽取会成为多模态RAG的标配能力一、面试最后一问:OCR...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签