返回列表
产品AI智能家居开源模型

小米开源7B多模态大模型MiMo-VL,赋能智能管家Miloco自动调节家居

小米今日在Hugging Face和GitHub同步发布了7B参数的多模态大模型“Xiaomi-MiMo-VL-Miloco-7B-GGUF”,并推出了基于该模型的智能管家“Xiaomi Miloco”。Miloco系统能够通过米家摄像头实时识别用户活动(如游戏、健身、阅读)和手势,自动联动灯光、空调、音乐等智能家居设备,并兼容Home Assistant协议。该模型采用非商用开源许可,用户可在具备NVIDIA GPU和Docker环境的Windows或Linux主机上一键部署。小米已公开模型权重与推理代码,但保留知识产权,禁止商业用途。

AI新闻资讯 - AI Base

小米公司于今日在Hugging Face和GitHub两大平台同步发布了其最新的7B参数多模态大模型“Xiaomi-MiMo-VL-Miloco-7B-GGUF”。与此同时,小米还推出了基于这一先进模型的智能管家系统“Xiaomi Miloco”。

“Xiaomi Miloco”智能管家系统具备强大的环境感知能力。它能够通过米家摄像头实时识别用户的多种活动,例如游戏、健身、阅读等,甚至可以识别特定的手势,如胜利手势或大拇指。基于这些识别结果,Miloco系统能够智能地联动家中的各类智能家居设备,包括灯光、空调和音乐播放器等,实现自动化调节,以适应用户的当前需求和偏好。值得一提的是,该系统还兼容Home Assistant协议,进一步增强了其在智能家居生态中的互操作性。

小米方面表示,“Xiaomi Miloco”采用非商用开源许可,这意味着用户可以在配备NVIDIA GPU和Docker环境的Windows或Linux主机上一键部署该系统。官方提供的示例展示了其默认工作流的多种应用场景,例如在用户阅读时自动开启台灯;根据用户是否盖被子来调节空调,以优化睡眠环境;以及在用户回家进门时,根据其穿衣风格生成个性化的语音评论。

小米已公开了该模型的所有权重和推理代码,以促进社区的交流与发展。然而,小米也明确指出,公司保留了该模型的知识产权,并严格禁止将其用于任何商业用途。

相关新闻

产品

Manus发布Browser Operator扩展:将任意浏览器升级为AI智能浏览器,提升工作效率

Manus公司推出了一款名为Manus Browser Operator的Chrome扩展程序,旨在将任何浏览器转变为具备AI能力的智能浏览器。该扩展能够自动化复杂的浏览器操作,并支持安全访问受保护的网站和系统,如研究平台和CRM工具。其核心功能包括安全的本地访问与会话复用,避免额外的登录验证和验证码,并能长期保持会话活跃。典型应用场景涵盖在数据库中查找资料、在CRM系统执行任务以及在付费平台提取数据。该扩展目前处于Beta测试阶段,逐步向Pro、Plus、Team高级用户开放,支持Chrome和Edge浏览器,旨在大幅提升日常工作效率。

产品

Quora Poe应用推出AI群聊功能,支持200人协作与多模态交互

Quora近日为其AI平台Poe推出了创新性的群聊功能,允许最多200名用户在单一对话中与不同的AI模型和机器人进行协作。该功能支持文本、图像、视频和音频生成等多种形式,旨在变革AI交互方式,为用户带来全新的互动体验。用户可以利用此功能规划旅行、创作Mood Board或参与智力游戏。Poe的群聊功能还具备实时同步聊天记录的特性,方便用户在不同设备间无缝切换。Quora表示,该功能已开发六个月,未来将根据用户反馈持续优化,并鼓励用户创建和分享自定义机器人以探索更多应用场景。

产品

ElevenLabs推出Image & Video(Beta):一站式AI视听内容创作平台,整合顶尖多模态模型

ElevenLabs正式推出Image & Video(Beta)平台,旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型,用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑,并支持唇形同步、超分辨率增强和时间轴调节等功能,最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台,提升内容创作效率和质量。