Multimodal AI Systems Architect (AI Engineering)

Hyphen Connect

9 hours ago

Full-time

On-site

San Francisco, California, United States

Multimodal AI Systems Architect (AI Engineering)

San Francisco Bay Area, USA We are seeking a talented Multimodal AI Systems Architect to develop and optimize AI systems that seamlessly integrate vision and audio models. This role focuses on enhancing our voice-to-voice interactions and multimodal retrieval capabilities, ensuring our systems are efficient and innovative. Responsibilities

Integrate vision encoders and audio-native models into core agent reasoning loops. Optimize streaming latency for voice-to-voice AI interactions. Architect multimodal RAG systems capable of retrieving insights from videos and PDFs. Qualifications

Experience with Whisper, CLIP, and multimodal LLM integration. Knowledge of streaming architectures and WebRTC. Expertise in cross-modal alignment.

Apply now

Multimodal AI Systems Architect (AI Engineering)

More jobs

Applied AI Engineer

Nexxa.ai

AI Engineer (San Francisco)

QAT Global | Custom Software Development & IT Staffing Solutions - US, Brazil & Costa Rica Nearshore