회의는 조직의 생명선입니다. 회의는 협업과 정보에 기반한 의사결정을 촉진합니다. 브레인스토밍과 문제 해결을 통해 업무의 폐쇄성을 제거합니다. 또한 전략적인 목표와 계획을 수립합니다.
하지만 이러한 목표를 달성하는 회의, 특히 부서 간 팀과 외부 참가자가 참여하는 회의를 진행하는 것은 쉽지 않을 수 있습니다. 의사결정을 원활하게 진행하고 회의 후 효과적인 업무 수행을 보장하기 위해서는 인력 관리 기술과 숙련된 문서화 전략의 적절한 조합이 필요합니다.
이 포스팅에서는 adam.ai의 지능형 메모 작성을 위한 클라우드 네이티브 마이크로서비스 기반 아키텍처를 소개합니다. NVIDIA Inception 프로그램의 일원인 adam.ai는 전체 회의 수명 주기 동안 조직, 팀 및 전문가의 역량을 강화하도록 설계된 포괄적인 회의 관리 플랫폼입니다. 이 아키텍처는 높은 확장성, 짧은 지연 시간, 온라인 회의에서 자동 메모 작성 서비스의 비용 효율적인 프로비저닝을 제공합니다. 구체적으로 adam.ai는 다음을 활용합니다:
- 처리 리소스의 자동 프로비저닝을 위한 구글 클라우드 데이터플로우(Google Cloud Dataflow)
- 지연 시간이 짧은 전사를 위한 NVIDIA Riva 음성-텍스트 변환(STT) 모델
- 효율적인 요약을 위한 거대 언어 모델(LLM)
AI 기반 자동 메모 작성
수동으로 메모를 작성하려면 어떤 정보를 기록하고 어떤 정보를 생략할지 실시간으로 결정해야 합니다. 게다가 능동적인 참여와 꼼꼼한 필기 사이의 균형을 맞추는 것은 아무리 능숙한 사람이라도 쉽지 않은 일입니다. 특히 장시간 또는 복잡한 토론이 진행되는 동안 집중력을 유지하는 데 필요한 인내심은 끊임없는 장애물로 남아 있습니다.
자동 음성 인식(ASR)과 언어 학습 기계의 발전은 회의 정보를 관리하고 정리하는 새로운 접근 방식의 길을 열어주었습니다. 자동 메모 작성은 전사의 힘을 활용하여 뉘앙스를 정확하고 깊이 있게 포착합니다.
전사 모델은 음성을 실시간으로 정확한 텍스트로 변환하여 팀, 기업 임원 및 전문가가 중요한 세부 사항을 간과하지 않고 포괄적인 회의록을 작성할 수 있도록 지원합니다. LLM은 이해, 추론, 지식 표현 능력을 활용하여 회의 데이터를 분석하고 귀중한 인사이트를 추출합니다.
사용자 친화적인 adam.ai 인터페이스를 통해 필수 안건에 액세스할 수 있고, 의사 결정과 실행 항목을 꼼꼼하게 추적할 수 있습니다(그림 1). 이러한 직관적인 접근 방식은 회의 관리를 용이하게 하고, 원활한 협업을 촉진하며, 우수한 회의 결과를 지원합니다.
전사 및 요약 아키텍처
adam.ai의 AI 엔지니어링 팀은 Google 클라우드용으로 특별히 설계된 마이크로서비스 아키텍처를 개발했습니다(그림 2). 메모 작성 시스템을 포함하는 이 아키텍처는 AWS 및 Azure와 같은 다른 클라우드 플랫폼으로 원활하게 전환할 수 있습니다.
이 아키텍처는 사용자의 데이터를 저장하고, 데이터 처리 리소스를 관리하고, 여러 구성 요소 간의 통신을 원활하게 하기 위해 스토리지, 데이터 흐름 및 게시/서브 시스템과 같은 Google 클라우드 구성 요소를 활용합니다.
회의 전사 기능은 탁월한 정확성과 짧은 지연 시간을 제공하는 동시에 대규모의 실시간 오디오 처리 작업을 효율적으로 처리하는 NVIDIA Riva 모델을 기반으로 합니다. Riva를 차별화하는 요소는 완벽한 사용자 지정 기능입니다. Riva는 법률 및 의료와 같은 전문 산업에 맞게 세밀하게 조정할 수 있어 틈새 어휘와 언어 사용에도 정확한 전사를 제공합니다. 또한 가변적인 수요에 대비하여 헬름 차트를 사용하여 Riva 모델을 배포하면 확장 가능한 리소스 관리가 가능하여 비용 효율적인 솔루션을 제공합니다.
노트 필기 데이터 흐름
adam.ai의 노트 필기 데이터 흐름은 네 가지 주요 단계를 통해 조율됩니다:
1단계: 노트 필기 작업 시작하기
새 회의 녹화가 업로드되면 이벤트 메시지가 생성되어 Google Cloud Pub/Sub 메시징 서비스를 통해 전송됩니다. 이 이벤트 중심의 분산 메커니즘은 느슨하게 결합된 아키텍처를 구축하여 특히 상당한 분석과 요약 시간이 필요한 장시간 회의를 처리할 때 플랫폼과 노트 필기 서비스 간의 커뮤니케이션을 간소화합니다.
2단계: 데이터 처리 파이프라인 시작
오디오 및 비디오 녹화의 위치를 캡슐화하는 이벤트 메시지는 맞춤형 데이터 처리 파이프라인을 통해 처리되어 회의 인사이트를 도출합니다. 이러한 파이프라인은 구글 클라우드 데이터 플로우를 통해 실행되므로 동적인 사용자 워크로드에 맞춰 컴퓨팅 리소스를 자동으로 프로비저닝할 수 있어 처리 작업의 성능과 비용 효율성을 최적화할 수 있습니다.
3단계: 회의 녹취록 생성
데이터 처리 파이프라인은 클라우드 스토리지에서 오디오 및 비디오 녹화물을 다운로드하는 것으로 시작됩니다. 그런 다음 다운로드한 파일을 NVIDIA Riva가 꼼꼼하게 트랜스크립션합니다. 음성을 텍스트로 단순 변환하는 것 이상의 기능을 제공하는 Riva는 문맥 이해를 통해 트랜스크립션 품질을 향상시킵니다. 구두점과 대소문자를 다듬어 강력하고 정확한 요약과 인사이트 생성을 제공합니다.
4단계: 요약 및 실행 가능한 인사이트 생성
꼼꼼하게 전사된 텍스트는 회의 내용을 요약하기 위해 LLM으로 전달됩니다. LLM은 정교한 프롬프트 엔지니어링을 통해 회의를 요약하고 가치 있고 실행 가능한 인사이트를 생성합니다. 그런 다음 회의 요약과 인사이트는 사용자에게 표시할 수 있도록 플랫폼으로 반환됩니다.
adam.ai 아키텍처의 이점
이 아키텍처는 효율적이고 확장 가능하며 비용 효율적인 회의 트랜스크립션 및 요약을 보장합니다. 구체적인 이점은 다음과 같습니다:
동적으로 확장 가능하고 내결함성 있는 시스템
이 아키텍처는 구글 클라우드 펍/서브를 사용하여 느슨하게 결합된 이벤트 중심 마이크로서비스 접근 방식을 채택하여 확장 가능하고 내결함성 있는 시스템을 구축합니다. 이는 커뮤니케이션을 간소화할 뿐만 아니라 구성 요소의 독립적인 기능을 제공합니다. 또한, 구글 클라우드 데이터플로우의 자동 리소스 프로비저닝은 컴퓨팅 성능을 동적으로 확장하여 비용 효율적인 데이터 처리를 가능하게 합니다.
실시간으로 정확한 회의 기록
Riva ASR 모델은 스트리밍 오디오를 지원하며 실시간으로 정확한 트랜스크립션을 제공합니다. 구두점과 대소문자를 세분화할 수 있는 기능으로 트랜스크립트 품질을 향상시켜 정확한 요약과 가치 있는 인사이트 추출을 가능하게 합니다.
이해하기 쉽고 체계적으로 정리된 요약본
LLM 통합은 이해하기 쉽고 체계적으로 정리된 요약을 제공하여 회의록에서 가치 있고 실행 가능한 인사이트를 추출할 수 있도록 도와줍니다.
직관적인 사용자 경험
전사부터 요약까지 전체 프로세스가 플랫폼에 원활하게 통합되어 있습니다. 요청과 결과는 게시/서브 시스템을 통해 효율적으로 전달되므로 원활하고 직관적인 사용자 경험을 제공하고 회의 인사이트에 쉽게 액세스할 수 있습니다.
요약
adam.ai로 회의를 더욱 생산적이고 역동적인 협업으로 전환하세요. ASR과 LLM이 함께 작동하여 모든 발언을 원활하게 캡처하고, 주요 인사이트를 추출하고, 상세한 메모를 생성합니다. 이를 통해 참가자는 메모 작성의 부담에서 벗어나 회의에 온전히 집중할 수 있습니다.
확장 가능하고 지연 시간이 짧으며 비용 효율적인 회의 오디오 데이터 처리를 보장하기 위해 adam.ai 회의 관리 플랫폼은 클라우드 네이티브 마이크로서비스 기반 아키텍처를 사용합니다. 이 아키텍처는 실시간으로 정확한 트랜스크립션과 NVIDIA Riva 기반의 향상된 구두점 및 대소문자 처리를 지원하여 회의에 대한 포괄적이고 정제된 기록을 제공합니다.
adam.ai가 회의의 수준을 높이는 데 어떻게 도움이 되는지 알아보려면 무료 평가판에 등록하세요. LLM 엔터프라이즈 애플리케이션에 대해 자세히 알아보려면 엔터프라이즈 솔루션용 거대 언어 모델 시작하기를 참조하세요. 그리고 NVIDIA Riva 포럼에서 음성 AI에 대한 토론에 참여하세요.