IntraScribe 是面向企业、学校与机关等内网环境的本地优先语音转写与协作平台:支持实时转写、说话人分离、高质量批处理、AI 总结与标题生成。默认提供浏览器 WebRTC 接入与 SSE 实时返回,也支持边缘设备/硬件作为前端,架构解耦、可替换任意采集与传输方案;数据全程留在本地,重视隐私与合规。
🔍 功能特性
本地优先与隐私保护:可在内网/离线环境独立部署,数据不外发,满足隐私与合规要求。
团队与组织协作:账号体系、模板共享与编辑流程,适配企业/学校多用户协作。
硬件友好与可插拔前端:支持浏览器或边缘设备/硬件作为采集端,传输方案可替换。
实时转写(本地 ASR):浏览器或硬件端录音,低延迟推流到后端,SSE 实时返回转写片段;支持断字清理与时间戳格式化。
批处理高质量转写:会话结束后整合缓存音频,自动上传至 Supabase Storage,调用通用音频处理服务进行说话人分离与重转写,提升质量与结构化程度。
说话人分离与重命名:基于 pyannote.audio 的说话人分离,完成后在前端可双击标签重命名,并同步更新数据库中的转写 segments。
AI 总结与标题生成:集成 LiteLLM,支持按模板生成结构化 Markdown 总结,并自动生成简洁标题;支持回退策略。
模板管理:支持用户模板与系统模板,设为默认、复制系统模板到用户侧、统计使用次数等。
录音会话管理:创建、完成、删除、重新转写、查看音频文件/转写/总结等;提供当前活跃会话状态与内存缓存状态查询。
数据存储与实时订阅:基于 Supabase(Postgres + Auth + Storage + Realtime);前端通过频道订阅感知会话/转写的变化并刷新界面。
可编辑的转写:在前端对转写进行局部编辑并保存回后端,保留/合成时间戳与说话人信息。
注册登录等的管理界面。
🎯 适用场景
企业/事业单位内网部署的会议记录与知识沉淀
学校/研究机构的课堂与研讨记录(支持多人与说话人标注)
会议室/指挥中心/生产现场等对隐私与延迟敏感的场景
涉及敏感数据的法务、医疗、研发等不允许数据外发的团队
- 开发者
「智医灵枢」是一款面向医疗行业的全能型AI智能助手,专为医生与行政人员打造,深度融合人工智能与权威医学知识,全面覆盖临床诊疗与行政办公双重场景。
LUMI 是一款接入30+AI工具的小说推文视频制作平台,一键生成爆款小说视频! 集改写、配音、图片生成等于一体,告别繁琐流程,轻松产出高质、吸睛的推文视频。专为小说推文从业者与副业创富者设计,让你真正用 AI 高效变现,掘金流量时代!
模力方舟官方应用,为您提供高效智能的 AI 助手服务。
AI文生图神器,一键开启,让创意秒现!注册免费试用,支持多图融合和动漫、写实、插画、3D等200+艺术风格,零基础玩转电商设计、社交创作。现在体验,让你的灵感瞬间跃然屏幕!

