API_标签_开发者_华为云

博客(2.0k)
视频(5)
论坛(0)
云声(75)
代码示例(0)

华为云上Gemini 3.5 Text-to-SQL深度评测：从单表查询到复杂多表联动的真实表现与调优实战
Text-to-SQL是衡量大模型企业级应用能力的一个硬核场景。它不像闲聊或摘要那样容错率高，一个SQL的细微偏差——少一个JOIN条件、用错聚合函数、WHERE子句逻辑优先级不对——就会直接导致查询结果与预期完全偏离。Gemini 3.5的发布带来了一个新变量：Google宣称其在结构化数据推理上有显著提升，背后有TPU架构加持的高吞吐和长上下文处理能力。对于华为云上的开发者而言，Gemi...

小李分享AI
发表于2026-06-05 09:24:57
213 0 0

213 0 0

Text-to-SQL是衡量大模型企业级应用能力的一个硬核场景。它不像闲聊或摘要那样容错率高，一个SQL的细微偏差——少一个JOIN条件、用错聚合函数、WHERE子句逻辑优先级不对——就会直接导致查询结果与预期完全偏离。Gemini 3.5的发布带来了一个新变量：Google宣称其在结构化数据推理上有显著提升，背后有TPU架构加持的高吞吐和长上下文处理能力。对于华为云上的开发者而言，Gemi...
API NAT SQL 人工智能数据库
GPT-5.5多模态落地实战：从“能识别”到“可控输出”隔着多少工程代码
把GPT-5.5的多模态能力接入业务系统跑了两周，最大的感受是：Demo里“能识别”到生产环境“可控输出”，中间隔着的不是模型能力，而是工程代码。事情是这样的。我们把GPT-5.5接入了财务报销系统，用户上传发票图片，系统自动抽取金额、税号、开票日期，结构化存入数据库。Demo跑得飞起，10张发票全对。上线第一周，出纳那边查出三笔金额对不上的——模型把“壹佰贰拾万元整”抽成了12万，少了个零...

小李分享AI
发表于2026-06-05 09:15:42
126 0 0

126 0 0

把GPT-5.5的多模态能力接入业务系统跑了两周，最大的感受是：Demo里“能识别”到生产环境“可控输出”，中间隔着的不是模型能力，而是工程代码。事情是这样的。我们把GPT-5.5接入了财务报销系统，用户上传发票图片，系统自动抽取金额、税号、开票日期，结构化存入数据库。Demo跑得飞起，10张发票全对。上线第一周，出纳那边查出三笔金额对不上的——模型把“壹佰贰拾万元整”抽成了12万，少了个零...
API JSON NAT SQL 人工智能
架构师深度解析：Claude 4.8的可扩展性瓶颈不在模型，在架构设计
当业务从日均千次调用增长到百万次，从单一场景扩展到多场景并行，从纯文本延伸到多模态融合——Claude 4.8的能力边界在哪里？不是模型的Token上限，不是厂商的速率限制，而是你的架构设计是否具备与业务同步扩展的能力。可扩展性这个词在AI应用中经常被窄化为“模型能处理多少并发”。但架构师视角下的可扩展性包含四个维度：容量扩展（业务量增长时系统能否线性扩容）、场景扩展（新增业务场景时是否需要...

小李分享AI
发表于2026-06-05 09:12:57
171 1 0

171 1 0

当业务从日均千次调用增长到百万次，从单一场景扩展到多场景并行，从纯文本延伸到多模态融合——Claude 4.8的能力边界在哪里？不是模型的Token上限，不是厂商的速率限制，而是你的架构设计是否具备与业务同步扩展的能力。可扩展性这个词在AI应用中经常被窄化为“模型能处理多少并发”。但架构师视角下的可扩展性包含四个维度：容量扩展（业务量增长时系统能否线性扩容）、场景扩展（新增业务场景时是否需要...
API NAT SQL 人工智能数据库
第4章：应用编程接口
CUDA 编程指南第4章：应用编程接口本文整理自 NVIDIA《CUDA Programming Guide Version 1.1》第4章，系统介绍 CUDA 的编程接口，包括 C 语言扩展、Runtime 组件、以及 Driver API 的使用方式。 4.1 C 编程语言扩展CUDA 编程接口的目标是为熟悉 C 语言的开发者提供简单的路径来编写设备端程序。它包括：组件说明语言扩展（...

叫我小刘就好了
发表于2026-06-04 15:06:59
191 0 1

191 0 1

CUDA 编程指南第4章：应用编程接口本文整理自 NVIDIA《CUDA Programming Guide Version 1.1》第4章，系统介绍 CUDA 的编程接口，包括 C 语言扩展、Runtime 组件、以及 Driver API 的使用方式。 4.1 C 编程语言扩展CUDA 编程接口的目标是为熟悉 C 语言的开发者提供简单的路径来编写设备端程序。它包括：组件说明语言扩展（...
API 任务调度
Gemini 3.5 Text-to-SQL 深度评测：从单表查询到多表联动的真实表现与调优指南
Text-to-SQL是衡量大模型企业级应用能力的一个硬核场景。它不像闲聊或摘要那样容错率高，一个SQL的细微偏差——少一个JOIN条件、用错聚合函数、WHERE子句逻辑优先级不对——就会直接导致查询结果与预期完全偏离。过去两年，GPT-4和Claude系列在这个领域各有优势，但Gemini 3.5的发布带来了一个新变量：Google宣称其在结构化数据推理上有显著提升，背后有TPU架构加持的...

小李分享AI
发表于2026-06-04 11:05:49
219 0 0

219 0 0

Text-to-SQL是衡量大模型企业级应用能力的一个硬核场景。它不像闲聊或摘要那样容错率高，一个SQL的细微偏差——少一个JOIN条件、用错聚合函数、WHERE子句逻辑优先级不对——就会直接导致查询结果与预期完全偏离。过去两年，GPT-4和Claude系列在这个领域各有优势，但Gemini 3.5的发布带来了一个新变量：Google宣称其在结构化数据推理上有显著提升，背后有TPU架构加持的...
API openGemini SQL 人工智能数据库
能耗与性能的平衡点：Gemini 3.5 在同精度下的算力效率对比
大模型评测有一个惯性思维：先用准确率跑个排名，再单独看延迟和吞吐，最后扫一眼成本。这套流程的盲区在于，它把性能、精度和成本当成三个独立变量，忽略了它们之间更本质的关系——算力效率。两个模型在同一个任务上达到同样的准确率，消耗的算力可能差出一倍。在规模化部署场景下，这种差距直接决定了硬件采购预算和电力成本。Google在Gemini 3.5的技术报告中花了相当篇幅强调TPU架构带来的效率优势，...

小李分享AI
发表于2026-06-04 11:03:17
176 0 0

176 0 0

大模型评测有一个惯性思维：先用准确率跑个排名，再单独看延迟和吞吐，最后扫一眼成本。这套流程的盲区在于，它把性能、精度和成本当成三个独立变量，忽略了它们之间更本质的关系——算力效率。两个模型在同一个任务上达到同样的准确率，消耗的算力可能差出一倍。在规模化部署场景下，这种差距直接决定了硬件采购预算和电力成本。Google在Gemini 3.5的技术报告中花了相当篇幅强调TPU架构带来的效率优势，...
API JSON openGemini 人工智能数据库
GPT-5.5 多模态落地实录：从“能识别”到“可控输出”中间隔着多少工程代码
GPT-5.5的多模态能力比上一代提升明显，这个结论在Demo阶段就能验证。把一张发票截图丢进去，金额、税号、开票日期整整齐齐返回JSON，准确率看着也不错。开发者这时候很容易产生一个错觉：多模态落地就是接个API的事。真上了生产才知道，Demo里“能识别”到业务上“可控输出”，中间隔着的东西比想象中多得多。上周我们把GPT-5.5接入了财务报销系统，前三天就跑出几个问题——一张折痕遮挡了金...

小李分享AI
发表于2026-06-04 11:00:47
162 0 0

162 0 0

GPT-5.5的多模态能力比上一代提升明显，这个结论在Demo阶段就能验证。把一张发票截图丢进去，金额、税号、开票日期整整齐齐返回JSON，准确率看着也不错。开发者这时候很容易产生一个错觉：多模态落地就是接个API的事。真上了生产才知道，Demo里“能识别”到业务上“可控输出”，中间隔着的东西比想象中多得多。上周我们把GPT-5.5接入了财务报销系统，前三天就跑出几个问题——一张折痕遮挡了金...
API JSON 人工智能数据库渲染
GPT-Image-2 实战评测：内容创作工作流中的真实价值与边界
图像生成模型在过去两年经历了从“玩具”到“工具”的转变。Midjourney重新定义了视觉审美的上限，Stable Diffusion用ControlNet解决了精准控制的难题，Flux Pro在真实感上建立了新的标杆。当GPT-Image-2发布时，行业关注点集中在它的文本渲染能力上——这确实是之前所有图像模型的集体短板。但内容创作者真正关心的问题是：它能否嵌入现有的创作工作流，在哪些环节...

小李分享AI
发表于2026-06-04 10:52:58
181 0 0

181 0 0

图像生成模型在过去两年经历了从“玩具”到“工具”的转变。Midjourney重新定义了视觉审美的上限，Stable Diffusion用ControlNet解决了精准控制的难题，Flux Pro在真实感上建立了新的标杆。当GPT-Image-2发布时，行业关注点集中在它的文本渲染能力上——这确实是之前所有图像模型的集体短板。但内容创作者真正关心的问题是：它能否嵌入现有的创作工作流，在哪些环节...
API Image 人工智能数据库渲染
大模型 API 密钥管理：从散落各处到统一治理的工程实践
Token 超市降低了企业接入大模型的门槛，但 API 密钥管理却成为被忽视的盲区。本文从近期多起安全事故切入，分析密钥分散管理的风险，并提出分层治理的工程方案，涵盖安全存储、访问控制、审计归因与异常检测。

AiKey Labs
发表于2026-06-04 09:57:16
249 1 0

249 1 0

Token 超市降低了企业接入大模型的门槛，但 API 密钥管理却成为被忽视的盲区。本文从近期多起安全事故切入，分析密钥分散管理的风险，并提出分层治理的工程方案，涵盖安全存储、访问控制、审计归因与异常检测。
API 人工智能成本中心架构设计
技术实践：保险健康APP引入第三方小程序实战，如何构建一个安全可控的沙箱环境～
保险类APP如何集成第三方服务商，把一些健康管理、医疗协助、康复养老、车后服务、法律咨询、税务规划类小程序引入到自己的APP中，然后通过安全沙箱进行管控，为每个小程序构建一套管控体系，提高安全性～

AI Coing中
发表于2026-06-04 09:50:34
201 0 0

201 0 0

保险类APP如何集成第三方服务商，把一些健康管理、医疗协助、康复养老、车后服务、法律咨询、税务规划类小程序引入到自己的APP中，然后通过安全沙箱进行管控，为每个小程序构建一套管控体系，提高安全性～
API 小程序移动APP
代码评测新范式：抛弃 HumanEval，我们给 Gemini 3.5 设计了 5 个生产级硬核测试
HumanEval 已经死了。不是字面意义上的死亡，而是作为一个衡量代码生成能力的基准，它早已被这个行业透支了所有公信力。当主流模型在 HumanEval 上的得分普遍超过 90% 时，这个指标就失去了区分度——就像用小学算术来评估数学博士的水平，大家都拿满分，但满分不代表能力趋同。真正的问题在于 HumanEval 的设计范式本身：孤立的函数签名、明确的输入输出、干净的上下文环境。这些特征...

小李分享AI
发表于2026-06-03 15:21:28
184 0 0

184 0 0

HumanEval 已经死了。不是字面意义上的死亡，而是作为一个衡量代码生成能力的基准，它早已被这个行业透支了所有公信力。当主流模型在 HumanEval 上的得分普遍超过 90% 时，这个指标就失去了区分度——就像用小学算术来评估数学博士的水平，大家都拿满分，但满分不代表能力趋同。真正的问题在于 HumanEval 的设计范式本身：孤立的函数签名、明确的输入输出、干净的上下文环境。这些特征...
API API/SDK JSON 人工智能数据库
GPT 5.5 多模态实战：结构化输出的稳定性与校验机制深度评测
多模态能力正在经历从“看图说话”到“看图出数”的关键转型。在企业场景中，模型能否从一张发票照片里准确提取出金额、税号和开票日期，并将这些字段以稳定的JSON格式返回给业务系统，比它能否用优美的文字描述这张发票的画面重要得多。结构化输出的稳定性，正在成为衡量多模态模型能否进入生产环境的核心指标。GPT 5.5在多模态能力上做了显著升级——图像理解的精细度更高，图文联合推理的连贯性更强，原生支持...

小李分享AI
发表于2026-06-03 15:18:07
185 0 0

185 0 0

多模态能力正在经历从“看图说话”到“看图出数”的关键转型。在企业场景中，模型能否从一张发票照片里准确提取出金额、税号和开票日期，并将这些字段以稳定的JSON格式返回给业务系统，比它能否用优美的文字描述这张发票的画面重要得多。结构化输出的稳定性，正在成为衡量多模态模型能否进入生产环境的核心指标。GPT 5.5在多模态能力上做了显著升级——图像理解的精细度更高，图文联合推理的连贯性更强，原生支持...
API API/SDK JSON 专业服务人工智能
Claude 4.8 迁移中被低估的致命伤：上下游依赖的版本一致性
模型迁移这件事，大部分技术团队的注意力都集中在模型本身——新模型的能力提升了多少，延迟有没有变化，Token消耗涨了多少。这些当然重要，但它们不是迁移中最危险的环节。真正让迁移从“平滑升级”变成“生产事故”的，往往是那些被默认“不会出问题”的组件——SDK版本、Prompt模板、下游解析逻辑、监控告警基线。它们各自独立看都没毛病，但组合在一起时，Claude 4.8带来的微小变化会被逐层放大...

小李分享AI
发表于2026-06-03 15:15:11
140 0 0

140 0 0

模型迁移这件事，大部分技术团队的注意力都集中在模型本身——新模型的能力提升了多少，延迟有没有变化，Token消耗涨了多少。这些当然重要，但它们不是迁移中最危险的环节。真正让迁移从“平滑升级”变成“生产事故”的，往往是那些被默认“不会出问题”的组件——SDK版本、Prompt模板、下游解析逻辑、监控告警基线。它们各自独立看都没毛病，但组合在一起时，Claude 4.8带来的微小变化会被逐层放大...
API API/SDK NAT 专业服务人工智能
架构师实战：Claude 4.8 性能抖动溯源与生产级稳定性治理
在将 Claude 4.8 接入生产环境的过程中，架构师面临的核心挑战并非模型能力的上限，而是性能表现的底线。一次偶发的延迟抖动可能触发上游服务超时重试，重试放大负载，进而演变为全链路雪崩。这类问题在测试环境中难以复现，却会在生产流量峰值下集中暴露。本文从架构视角出发，系统梳理 Claude 4.8 的性能稳定性特征，分析抖动的根因分布，并提供经过生产验证的治理方案。在正式进入架构设计之前，...

小李分享AI
发表于2026-06-03 14:55:58
114 0 0

114 0 0

在将 Claude 4.8 接入生产环境的过程中，架构师面临的核心挑战并非模型能力的上限，而是性能表现的底线。一次偶发的延迟抖动可能触发上游服务超时重试，重试放大负载，进而演变为全链路雪崩。这类问题在测试环境中难以复现，却会在生产流量峰值下集中暴露。本文从架构视角出发，系统梳理 Claude 4.8 的性能稳定性特征，分析抖动的根因分布，并提供经过生产验证的治理方案。在正式进入架构设计之前，...
API NAT 人工智能
云上多模态AI评测指南：Claude 4.8同等成本约束下的能力边界与工程实践
在企业AI应用从文本单模态向多模态演进的进程中，开发者面临的核心问题已从“是否接入多模态能力”转变为“如何在预算约束下最大化多模态能力的投入产出比”。Claude 4.8在多模态维度上的提升引发了广泛关注，但在实际工程落地中，同等成本下不同模型的能力上限差异显著，且评测方法直接影响结论的可靠性。在多模型选型评测阶段，开发者可以借助 KULAAI（dl.877ai.cn）等专业的多模型对比测...

小李分享AI
发表于2026-06-03 14:51:06
123 0 0

123 0 0

在企业AI应用从文本单模态向多模态演进的进程中，开发者面临的核心问题已从“是否接入多模态能力”转变为“如何在预算约束下最大化多模态能力的投入产出比”。Claude 4.8在多模态维度上的提升引发了广泛关注，但在实际工程落地中，同等成本下不同模型的能力上限差异显著，且评测方法直接影响结论的可靠性。在多模型选型评测阶段，开发者可以借助 KULAAI（dl.877ai.cn）等专业的多模型对比测...
API 人工智能

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript