D

AI Engineer - Ingénieur(e) en IA

Datmos
2 hours ago
Full-time
On-site
Salem, Oregon, United States
Job Description:

Développer et optimiser des workflows agentiques complexes et multi-étapes permettant à l'IA d'exécuter des tâches et des prises de décision autonomes. Concevoir et maintenir des systèmes de génération augmentée par récupération (RAG) pour connecter les LLM aux données propriétaires de manière sécurisée et précise. Évaluer et configurer divers LLM en fonction des contraintes spécifiques aux projets, telles que la latence, le coût et la confidentialité des données. Établir des normes de conception d'instructions pour garantir que les sorties des modèles sont fiables, sécurisées et adaptées au contexte. Concevoir des stratégies de mémoire à court et long terme pour les systèmes agentiques. Requirements:

3+ ans d'expérience dans un environnement d'agence (ou en consultation dans un environnement au rythme rapide). Intérêt démontré pour les outils d'IA avec au moins 2-3 cas d'utilisation documentés et appliqués à des projets actuels ou passés. 5 ans et plus en génie logiciel, avec de solides compétences en programmation (Python/Backend). Expérience avec les agents, le protocole MCP ou l'orchestration logicielle liée à l'IA, et les lacs de données (BigQuery, Databricks, Snowflake). Connaissance approfondie des techniques de prompt engineering et des nuances/forces spécifiques des principaux modèles fondateurs. Développement d'architectures cloud optimisées pour le temps réel et l'IA. Expérience pratique avec des frameworks agentiques tels que LangChain, LlamaIndex, CrewAI, AutoGen, ou des implémentations personnalisées d'appel d'outils (tool-calling) utilisant les API natives des modèles. Expérience pratique des entrepôts vectoriels (Pinecone, Weaviate, pgvector, ChromaDB), incluant les stratégies d'indexation, le réglage de la recherche par similarité et les approches de récupération hybride. Familiarité avec les méthodes de réglage fin efficaces en paramètres (LoRA, QLoRA) et savoir quand appliquer le fine-tuning vs le prompt engineering vs le RAG pour un cas d'utilisation donné. Compréhension des injections de prompts, des vecteurs de jailbreaking et des risques de fuite de données spécifiques aux LLM — et capacité à concevoir des mesures d'atténuation au niveau de l'architecture. Capacité à concevoir des workflows techniques évolutifs capables de gérer efficacement un volume élevé de requêtes IA. Forte capacité à déboguer les comportements de modèles « boîte noire » et à itérer jusqu'à ce que les seuils de précision soient atteints. Benefits:

Accès à des assurances santé payées en partie par l’employeur (assurances pour vous et votre famille). Vacances et jours mobiles pour vous reposer. Politique de déconnexion pour favoriser l'équilibre vie professionnelle/vie personnelle. Flexibilité quant à votre lieu de travail et vos horaires (bureaux aux États-Unis et au Canada, possibilité de faire du télétravail à 100%). Un programme de reconnaissance sous forme de cartes-cadeaux ou de dons à des associations.