- Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集Blattmann A, Dockhorn T, Kulal S, et al. Stable video diffusion: Scaling latent video diffusion models to large datasets[J]. arXiv preprint arXiv:2311.1512... Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集Blattmann A, Dockhorn T, Kulal S, et al. Stable video diffusion: Scaling latent video diffusion models to large datasets[J]. arXiv preprint arXiv:2311.1512...
- 该方法在继承 Transformer 模型强大建模能力的同时,结合古籍特有的稀疏结构与复杂布局特点,设计了多项创新机制。其核心目标是:在有限训练数据下,依旧能够实现对古籍逻辑结构(如段落、标题、注释)与物理结构(如文字块、插图、边框)的精准识别与定位。 该方法在继承 Transformer 模型强大建模能力的同时,结合古籍特有的稀疏结构与复杂布局特点,设计了多项创新机制。其核心目标是:在有限训练数据下,依旧能够实现对古籍逻辑结构(如段落、标题、注释)与物理结构(如文字块、插图、边框)的精准识别与定位。
- Phi-4 技术报告深度解读Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 引言:小模型的强大潜能微软研究院在2024年12月发布的 phi-4 是一个仅有140亿参数的语言模型,却在多个推理任务上展现出与千亿参数级别模型相媲美的性能。这个成... Phi-4 技术报告深度解读Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 引言:小模型的强大潜能微软研究院在2024年12月发布的 phi-4 是一个仅有140亿参数的语言模型,却在多个推理任务上展现出与千亿参数级别模型相媲美的性能。这个成...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数... EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数...
- AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501.... AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501....
- 边缘AI优化:数据、模型与系统策略的综合调研——论文阅读Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 第一章 引言与研究背景 1.1 研究动机与挑战人工智能技术... 边缘AI优化:数据、模型与系统策略的综合调研——论文阅读Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 第一章 引言与研究背景 1.1 研究动机与挑战人工智能技术...
- I-ViT: 用于高效视觉Transformer推理的纯整数量化Li Z, Gu Q. I-vit: Integer-only quantization for efficient vision transformer inference[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision.... I-ViT: 用于高效视觉Transformer推理的纯整数量化Li Z, Gu Q. I-vit: Integer-only quantization for efficient vision transformer inference[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision....
- 模型量化技术简要详解 模型量化的本质与基础原理模型量化技术本质上是一种精度与效率的权衡艺术。想象一下,如果我们用数字来记录一个房间的温度,使用小数点后十位的精度(如23.1234567890°C)虽然非常精确,但在日常生活中,精确到小数点后一位(23.1°C)就足够了。模型量化的核心思想与此类似——将神经网络中的高精度浮点数(通常是32位浮点数,FP32)转换为低精度的整数表示(如8位整数... 模型量化技术简要详解 模型量化的本质与基础原理模型量化技术本质上是一种精度与效率的权衡艺术。想象一下,如果我们用数字来记录一个房间的温度,使用小数点后十位的精度(如23.1234567890°C)虽然非常精确,但在日常生活中,精确到小数点后一位(23.1°C)就足够了。模型量化的核心思想与此类似——将神经网络中的高精度浮点数(通常是32位浮点数,FP32)转换为低精度的整数表示(如8位整数...
- MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202... MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202...
- H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil... H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil...
- SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni... SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni...
- 用于最近邻搜索的乘积量化H. Jégou, M. Douze and C. Schmid, “Product Quantization for Nearest Neighbor Search,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 1, pp. 117-128, Ja... 用于最近邻搜索的乘积量化H. Jégou, M. Douze and C. Schmid, “Product Quantization for Nearest Neighbor Search,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 1, pp. 117-128, Ja...
- 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret... 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签