- LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等] LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等]
- 本文作者:陈冠宏(华为网络MSSD首席顾问)全文约4497字,阅读约需10分钟在本年度的517电信日上,中国电信高层在产品升级计划发布会中喊出“ALL in AI”战略,其震撼力让人瞩目。自2022年11月OpenAI推出划时代的ChatGPT以来,技术的日新月异似乎从未停歇,如:2023年3月见证了GPT-4的诞生,2024年2月Sora的亮相,紧接着5月GPT-4o的登场,时至今日,AI... 本文作者:陈冠宏(华为网络MSSD首席顾问)全文约4497字,阅读约需10分钟在本年度的517电信日上,中国电信高层在产品升级计划发布会中喊出“ALL in AI”战略,其震撼力让人瞩目。自2022年11月OpenAI推出划时代的ChatGPT以来,技术的日新月异似乎从未停歇,如:2023年3月见证了GPT-4的诞生,2024年2月Sora的亮相,紧接着5月GPT-4o的登场,时至今日,AI...
- 序列到序列(Seq2Seq)模型是一种深度学习模型,广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序列(如一句话)映射到另一个序列。本文将详细介绍 Seq2Seq 模型的原理,并使用 Python 和 TensorFlow/Keras 实现一个简单的 Seq2Seq 模型。 1. 什么是序列到序列模型?Seq2Seq 模型通常由两个主要部分组成:编码器(Enc... 序列到序列(Seq2Seq)模型是一种深度学习模型,广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序列(如一句话)映射到另一个序列。本文将详细介绍 Seq2Seq 模型的原理,并使用 Python 和 TensorFlow/Keras 实现一个简单的 Seq2Seq 模型。 1. 什么是序列到序列模型?Seq2Seq 模型通常由两个主要部分组成:编码器(Enc...
- LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent! LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
- 【LangChain系列】第六篇:内存管理 【LangChain系列】第六篇:内存管理
- LLM 大模型学习必知必会系列(五):数据预处理(Tokenizer分词器)、模板(Template)设计以及LLM技术选型 LLM 大模型学习必知必会系列(五):数据预处理(Tokenizer分词器)、模板(Template)设计以及LLM技术选型
- 【LangChain系列】第四篇:向量数据库与嵌入 【LangChain系列】第四篇:向量数据库与嵌入
- 【AI】从零构建一个深度学习框架 【AI】从零构建一个深度学习框架
- 变分自编码器(Variational Autoencoder,VAE)是一种生成模型,能够学习数据的潜在表示并生成新数据。VAE在自编码器的基础上增加了概率建模,使得其生成的数据具有更好的多样性和连贯性。本教程将详细介绍如何使用Python和PyTorch库实现一个简单的VAE,并展示其在MNIST数据集上的应用。 什么是变分自编码器(VAE)?变分自编码器(VAE)由编码器、解码器和潜在变... 变分自编码器(Variational Autoencoder,VAE)是一种生成模型,能够学习数据的潜在表示并生成新数据。VAE在自编码器的基础上增加了概率建模,使得其生成的数据具有更好的多样性和连贯性。本教程将详细介绍如何使用Python和PyTorch库实现一个简单的VAE,并展示其在MNIST数据集上的应用。 什么是变分自编码器(VAE)?变分自编码器(VAE)由编码器、解码器和潜在变...
- 线性回归是统计学中最基础且广泛使用的预测模型之一。它通过找到最佳拟合直线(或超平面)来描述因变量(目标变量)与自变量(预测因子)之间的关系。本文将探讨线性回归的核心理论,常见问题,如何避免这些错误,并提供一个实践案例及代码示例。 核心理论知识模型假设:线性回归假设因变量与自变量之间存在线性关系,即y = β0 + β1x1 + β2x2 + ... + βnxn + ε,其中y是因变量,x是... 线性回归是统计学中最基础且广泛使用的预测模型之一。它通过找到最佳拟合直线(或超平面)来描述因变量(目标变量)与自变量(预测因子)之间的关系。本文将探讨线性回归的核心理论,常见问题,如何避免这些错误,并提供一个实践案例及代码示例。 核心理论知识模型假设:线性回归假设因变量与自变量之间存在线性关系,即y = β0 + β1x1 + β2x2 + ... + βnxn + ε,其中y是因变量,x是...
- 检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统 检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统
- RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术 RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
- 基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型) 基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)
- PyTorch是一个开源的机器学习库,专注于深度学习领域的应用,如计算机视觉和自然语言处理。自2016年由Facebook的人工智能研究团队(FAIR)开发以来,PyTorch迅速成为深度学习研究和应用中最受欢迎的框架之一。 PyTorch是一个开源的机器学习库,专注于深度学习领域的应用,如计算机视觉和自然语言处理。自2016年由Facebook的人工智能研究团队(FAIR)开发以来,PyTorch迅速成为深度学习研究和应用中最受欢迎的框架之一。
- NL2SQL实践系列(2):2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)以及工业级案例教学 NL2SQL实践系列(2):2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)以及工业级案例教学
上滑加载中
推荐直播
-
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day1)
2025/03/29 周六 09:00-18:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day2)
2025/03/30 周日 09:00-12:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
从AI基础到昇腾:大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30
不易 / 华为云学堂技术讲师
昇腾是华为研发的AI芯片,其具有哪些能力?我们如何基于其进行开发?本期直播将从AI以及大模型基础知识开始,介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区,旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
热门标签