Lora - 搜索 News

腾讯网3 小时

DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，教程在此

在准备好数据集和模型权重后，可使用Colossal-AI 提供的一键启动脚本 ...

腾讯网3 小时

DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

机器之心发布机器之心编辑部DeepSeek V3/ R1 火爆全网，基于原始模型的解决方案和 API ...

5 天

LoRa联盟发布2024年年度报告

支持物联网 (IoT）低功耗广域网 (LPWAN）开放式LoRaWAN ® LoRa 标准的全球企业协会联盟Alliance（LoRa ® ...

4 小时

重磅发布！DeepSeek 微调秘籍揭秘，AI 玩家必备升级版全家桶

在当今人工智能技术迅猛发展的背景下，AI工具的不断推陈出新成为了众多开发者乃至普通用户关注的焦点。近日，基于强大原始模型的DeepSeek ...

6 天

突破性技术：平安科技申请LoRA微调专利提升卷积神经网络效率

在人工智能与深度学习技术不断发展的背景下，各大科技公司纷纷在其业务模块中引入创新技术，以提升运算效率和模型性能。近日，平安科技（深圳）有限公司申请了一项新专利，名称为“基于LoRA的注意力对齐微调方法、装置、设备及介质”，引发了专业圈内的广泛关注。这项专利旨在加快卷积神经网络的微调速度，同时又不增加推理时的计算量，这一创新可能对未来的AI模型训练和应用产生深远影响。

GitHub8 天

WanderJN/LLAMA_LoRA

2.准备lora层实现的类，以及为模型某层更改并注入lora层的函数，详见lora.py； 3.为模型注入lora，加载数据集，训练模型，保存lora层的参数，详见lora_finetune.py； 4.读取原模型，注入训练好的lora参数，合并模型，并对模型进行测试，详见merge_and_test_llama.py； ...

4 天

炒菜、雕刻、绘画、汽车人变形！MakeAnything用扩散Transformer解锁多 ...

人类智慧的一大特征是能够分步骤创造复杂作品，例如绘画、手工艺和烹饪等，这些过程体现了逻辑与美学的融合。然而，让 AI 学会生成这样的 “步骤教程” ...

腾讯网8 天

用户生成奥特曼侵权图片，AI平台要担责？杭州互联网法院判决解析 ...

近年来，生成式人工智能技术一直是科技发展前沿的热门话题，ChatGPT、DeepSeek的横空出世点燃全球对生成式人工智能技术的讨论热潮。当您为AI生成的爆款图片点赞时，当您转发AI生成的二创内容时，是否想过AI生成内容可能触及法律红线？是否想过生成 ...

eeworld.com.cn3 小时

Nordic Semiconductor 赋能 Matter over Thread 智能庭院门锁

挪威奥斯陆 – 2025年2月19日 – 丹麦智能安防公司 Secuyou 推出了一款由Nordic Semiconductor赋能的 Matter over Thread兼容无线智能锁。这种智能锁可以方便地安装在庭院门上，让房主无需钥匙就能通过智能手机进入家中。用户还可以远程向经授权的第三方 (如可信赖的技工或家庭成员)提供访问权限。

红板报 on MSN2 天

这次不是卷参数、卷算力，而是卷“跨界学习”——

靳晨投稿量子位 | 公众号 QbitAI 这次不是卷参数、卷算力，而是卷“跨界学习”—— 让Stable Diffusion当老师，教多模态大模型（如Llama-3.2）如何“看图说话”！性能直接飙升30%。

头部财经4 天

结构为王：AI 推理新思路，思维链结构成突破 LLM 高效训练关键

提升 LLM 推理能力的难点在于训练模型生成具有结构化自反思、验证和回溯的长链式思维（CoT）响应。现有模型的训练过程通常需要在大量数据集上进行昂贵的微调，且许多专有模型的训练方法并不公开。

2 天on MSN

多模态模型Vidu1.5突破，Scaling Law迎来新拐点？

回顾大语言模型的发展历程，从GPT-2到GPT-3.5的质变，同样实现了从预训练+特定任务微调向统一框架的突破。Vidu 1.5的推出，标志着多模态大模型正经历着类似于GPT-3.5的时刻。这一突破不仅体现在技术上，更在于设计理念上的革新。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果