Trabajo de ingeniero de fiabilidad de sitios remoto

En Turing buscamos ingenieros de fiabilidad de instalaciones que se encarguen de automatizar soluciones que incluyan la planificación de la capacidad y el rendimiento, la gestión de riesgos, la respuesta ante desastres y la supervisión de guardia. Esta es tu oportunidad de trabajar con empresas de élite de Estados Unidos y colaborar con los mejores profesionales de todo el mundo.

Echa un vistazo a los mejores empleos para mayo 2024aquí

Descubre trabajos remotos en software con centenas de clientes de Turing

Descripción del puesto

Responsabilidades del puesto

  • Construir aplicaciones de software para ayudar a los equipos de operaciones y soporte.
  • Recopilar y analizar métricas para ayudar en el ajuste del rendimiento y la resolución de errores.
  • Contribuir a la consultoría de diseño de sistemas, la gestión de plataformas y la planificación de la capacidad.
  • Desarrollar sistemas y servicios sostenibles con la automatización y los aumentos.
  • Mejorar la velocidad de desarrollo de las funciones y la fiabilidad del sistema mediante la optimización de los procesos de guardia.
  • Preparar la documentación de los conocimientos históricos relativos al desarrollo de software, el soporte, las operaciones de TI y las tareas de guardia.
  • Supervisar el rendimiento de las aplicaciones y mantener los sitios en funcionamiento.

Requisitos mínimos

  • Licenciatura/Máster en Ingeniería, Informática o TI (o experiencia equivalente)
  • Al menos 3 o más años de experiencia como ingeniero de fiabilidad de sitios (con algunas excepciones para ingenieros sumamente capacitados)
  • Conocimiento experto de los sistemas operativos (Linux/Windows)
  • Conocimiento experto de los conceptos y mejores prácticas de DevOps
  • Experiencia en la implementación de CI/CD.
  • Experiencia práctica en la resolución de problemas.
  • Conocimiento de uno o más lenguajes de programación de alto nivel como Python, Java, JavaScript, C/C++, Ruby, etc.
  • Experiencia con tecnologías de almacenamiento distribuido y marcos de gestión de recursos dinámicos.
  • Fluidez e inglés para comunicarse eficazmente.
  • Disponibilidad para trabajar full-time (40 hs. por semana) con una superposición de 4 horas con los husos horarios de EE.UU.

Habilidades preferidas

  • Conocimiento práctico de herramientas de versionado de código como Git.
  • Proactividad en la búsqueda de problemas, cuellos de botella en el rendimiento y áreas de mejora.
  • Pasión por la automatización, habilidades de codificación y mentalidad centrada en el software.
  • Conocimiento de la computación distribuida, las aplicaciones nativas de la nube, la supervisión de aplicaciones y la gestión de bases de datos.
  • Excelentes habilidades organizativas e interpersonales.

¿Interesado en este trabajo?

Aplica a Turing hoy mismo.

Aplicar ahora

¿Por qué unirse a Turing?

Elite US Jobs

1Empleos de élite en EE. UU.

Los desarrolladores de Turing obtienen un salario superior al del mercado local en la mayoría de los países gracias a que colaboran con las mejores empresas estadounidenses.
Career Growth

2Crecimiento profesional

Crece rápidamente trabajando en problemas desafiantes, tanto técnicos como de negocio utilizando las tecnologías más actuales.
Developer success support

3Asistencia al Desarrollador

Mientras estes emparejado, disfruta de asistencia 24/7 a los desarrolladores.

Desarrolladores Turing

Lee las reseñas sobre Turing.com de desarrolladores de todo el mundo y descubre como es trabajar con las mejores empresas de EE.UU.
4.6DE 5
Basado en las opiniones de los desarrolladores a abril 2024
Ver todas las reseñas

¿Cómo convertirse en un desarrollador de Turing?

Trabaja con las mejores compañías de software en solo 4 sencillos pasos
  1. Crea tu perfil

    Completa tus datos básicos: nombre, ubicación, conocimientos, expectativa salarial y experiencia.

  2. Realiza nuestras pruebasy entrevistas

    Resuelve pruebas y asiste a una entrevista técnica.

  3. Recibe ofertas de trabajo

    Las mejores empresas de EE.UU. y Silicon Valley te elegirán como colaborador.

  4. Obtén el trabajo de tus sueños

    Una vez que seas parte de Turing, ya no tendrás que volver a buscar otro trabajo.

cover

¿Cómo convertirte en ingeniero de fiabilidad de sitios?

A medida que el desarrollo de software se volvió más rápido y complejo, los equipos de software tradicionales tuvieron problemas para mantenerse al día. Por eso, para ayudar con la transición de los flujos de trabajo de las aplicaciones de desarrollo a las de producción, introdujeron DevOps. Sin embargo, se hizo cada vez más evidente que este sistema necesitaba mayor confiabilidad y rendimiento para seguir siendo competitivo. Aquí es donde entra en juego el campo de la ingeniería de fiabilidad de sitios.

Ésta, combina prácticas de ingeniería de software con aquellas de ingeniería de tecnología de la información (TI) para crear sistemas altamente confiables. Los ingenieros de este campo son responsables de garantizar la confiabilidad de todos los aspectos de la pila completa, desde las aplicaciones frontales orientadas al cliente hasta la base de datos y la infraestructura de hardware.

¿Cuál es el alcance de la ingeniería de fiabilidad de sitios?

El rol de SRE (Systems and Release Engineer) es ideal para evaluar el desarrollo más reciente en el mundo DevOps, ampliando sus conocimientos y habilidades en áreas de alta demanda, como la automatización de infraestructura, la ingeniería de lanzamiento y la entrega continua. Como SRE, deberás ser muy creativo, estar estimulado y contar con desafíos técnicos todos los días.

Los ingenieros de fiabilidad de sitios son cruciales para la mayoría de las organizaciones, ya que estos profesionales tienen una gran demanda en empresas tecnológicas exitosas que cuentan con grandes centros de datos y desafíos técnicos complejos. También pueden ser inspiradores tanto desde la perspectiva financiera, como de la cultura del lugar de trabajo. Google los considera recursos escasos.

¿Cuáles son las funciones y responsabilidades de un ingeniero de fiabilidad de sitios??

La ingeniería de fiabilidad de sitios (SRE) se refiere a los enfoques de ingeniería de software utilizados por las organizaciones para administrar sus operaciones de TI. Los equipos de SRE utilizan herramientas de software como una forma de automatizar operaciones y resolver problemas de manera oportuna. Los SRE tienen experiencia en ingeniería de software, redes y administración de sistemas Unix, como así también habilidades de programación pulidas, por el hecho de que utilizan regularmente la automatización para reducir el trabajo humano y aumentar la confiabilidad. Además, transfiere el trabajo tedioso que tradicionalmente realizan los equipos de operaciones y DevOps a los ingenieros de software que pueden utilizar la automatización y el software para optimizar los procesos. Estos ingenieros dedican la mitad de su tiempo al trabajo de desarrollo y la otra mitad, a tareas de operaciones, tales como responder a interrupciones e incidentes y estar de guardia.

Las funciones y responsabilidades de un ingeniero de fiabilidad de sitios incluyen:

  • Creación de software para ayudar a los equipos de operaciones y soporte.
  • Realización de revisiones posteriores al incidente.
  • Documentar el conocimiento para garantizar un flujo continuo de información entre los equipos.
  • Implementar estrategias para aumentar la confiabilidad y el rendimiento del sistema a través de la rotación de guardia.
  • Solucionar casos relacionados con la escalada de soporte.
  • Incorporar varios aspectos de ingeniería de software para desarrollar e implementar servicios que mejoren la TI y los equipos de soporte.
  • Optimizar el ciclo de vida de desarrollo de software (SDLC) para aumentar la confiabilidad del servicio.

¿Cómo convertirte en un ingeniero de fiabilidad de sitios?

Puedes convertirte en un ingeniero de fiabilidad de sitios de las siguientes maneras:

  1. Licenciatura: Es obligatorio que el desarrollador cuente con una Licenciatura o Maestría, debido a que colabora en el crecimiento del campo del software y también a comprender fácilmente los aspectos técnicos del trabajo.
  2. 2 o más años de experiencia en funciones de operaciones o ingeniería de software. Suma si tienes experiencia previa trabajando como ingeniero de software, ya que te dará una ventaja sobre otros candidatos al intentar puestos en la SRE.
  3. Habilidades requeridas: Debes tener las siguientes habilidades técnicas.
  • Experiencia con ciclos de vida de desarrollo de software basados ​​en implementación continua en la nube.
  • Experiencia en tecnologías de automatización de infraestructura.
  • Junto con las habilidades técnicas, también debes tener una base sólida de habilidades no técnicas. Qué necesitas:
  • Excelentes habilidades de comunicación oral y escrita.
  • Fuertes habilidades para resolver problemas.
  • Pasión y curiosidad por la tecnología.
  • Ganas de brindar soporte a equipos o clientes.

¿Estás interesado en trabajos remotos de fiabilidad de sitios?

¡Conviértete en un desarrollador de Turing!

Aplica ahora

Habilidades requeridas para convertirte en un ingeniero de fiabilidad de sitios

Las habilidades fundamentales son importantes para ayudarte a conseguir trabajos bien remunerados como ingeniero de fiabilidad de sitios. ¡Aquí está lo que necesitas saber!

1. DevOps

DevOps se refiere a un conjunto de prácticas que promueven una mejor colaboración y automatización generalizada de los procesos que ocurren entre los equipos operativos y de desarrollo. También se puede extender a otras unidades de negocio.

Es un nuevo movimiento cultural que combina desarrollo de software, operaciones e ingeniería. Estimula la adopción de prácticas ágiles de naturaleza continua, permitiendo la entrega continua de lotes pequeños a los clientes.

2. Python

Python es un lenguaje fácil y dinámico de aprender. Considerado de alto nivel con una estructura interpretada para hacer que los errores de depuración sean relativamente sencillos, lo que ayuda a los programadores a desarrollar rápidamente prototipos de aplicaciones funcionales. Esta característica le ha ganado a Python una reputación como lenguaje muy adecuado para la codificación, debido a que admite sistemas operativos multiplataforma, siendo una buena opción para los programadores, especialmente quienes no quieren perder tiempo escribiendo programas separados para diferentes sistemas operativos.

3. Go

Go se creó para aplicaciones relacionadas con la infraestructura de red, con el fin de reemplazar a Java y C++. Se utiliza en aplicaciones basadas en la nube o del lado del servidor (web). Junto a DevOps, la automatización de la confiabilidad del sitio, la programación de microcontroladores, la robótica y los juegos, son usuarios comunes de Go. Además, se utiliza en el mundo de la inteligencia artificial y la ciencia de datos.

4. CI/DC

Es un proceso de desarrollo de software en el que el código se construye y se testea automáticamente a medida que se le agrega código nuevo. CI/CD puede mejorar la eficacia de un equipo de software al reducir el riesgo de errores o defectos y permitir implementaciones automatizadas, liberando el tiempo dedicado a crear, probar o lanzar software manualmente.

Además, introduce procesos automatizados para integrar código y realizar pruebas de forma continua con la entrega y la implementación, reemplazando los procesos manuales propensos a errores. Cuenta con el respaldo de equipos que trabajan juntos de manera ágil, ya sea con prácticas DevOps o SRE.

5. Control de versiones

Los sistemas de control de versiones o revisión ayudan a los desarrolladores de software a realizar un seguimiento de los cambios en el código de la aplicación y a administrar el desarrollo de un solo programa, por parte de más de una persona. Los sistemas de control de versiones como Git tienen la capacidad de crear ramas, donde un desarrollador puede hacer una copia de un proyecto existente y modificar uno o más archivos.

6. Bases de datos NoSQL

Son una clase de sistemas de administración de bases de datos (DBMS) que no se basan en la estructura tradicional del sistema de administración de bases de datos relacionales (RDBMS). Están diseñadas específicamente para modelos de datos específicos, tienen esquemas flexibles para crear aplicaciones modernas y son ampliamente reconocidas por su facilidad de desarrollo y rendimiento a escala. Estas bases de datos usan varios modelos de datos para acceder y administrar datos, lo que las optimiza específicamente para aplicaciones que requieren un gran volumen de datos, baja latencia y modelos de datos flexibles.

¿Estás interesado en trabajos remotos de fiabilidad de sitios?

¡Conviértete en un desarrollador de Turing!

Aplica ahora

¿Cómo obtener trabajos remotos de ingeniero de fiabilidad de sitios?

Los desarrolladores se parecen mucho a los atletas. Para sobresalir en su oficio, tienen que practicar de manera efectiva y consistente. También necesitan trabajar lo suficientemente duro para que sus habilidades crezcan gradualmente con el tiempo. En este sentido, hay dos factores principales en los que debes centrarte para que se produzca ese progreso: el apoyo de alguien que tenga más experiencia y sea más eficaz en las técnicas de práctica mientras tú practicas. Como desarrollador, es vital que sepas cuánto ejercitarte, así que asegúrate de que haya alguien disponible que te ayude y esté atento a cualquier signo de agotamiento.

Turing ofrece los mejores trabajos de ingeniero de fiabilidad de sitios remotos que se adaptan a su trayectoria profesional. Crece rápidamente trabajando en problemas técnicos y comerciales desafiantes con las últimas tecnologías. Únete a la red de los mejores desarrolladores del mundo y obtén trabajos de ingeniero de fiabilidad de sitios remotos a tiempo completo y a largo plazo con una mejor compensación y crecimiento profesional.

¿Por qué convertirte en un ingeniero de fiabilidad de sitios en Turing?

Trabajos de élite en Estados Unidos.
Crecimiento profesional.
Comunidad de desarrolladores exclusiva.
Una vez que te unas a Turing, nunca más tendrás que solicitar otro trabajo.
Trabaja desde la comodidad de tu casa.
Gran compensación.

¿Cuánto paga Turing a sus ingenieros de fiabilidad de sitios?

Cada ingeniero de fiabilidad de sitios en Turing tiene la capacidad de establecer su propia tarifa. Sin embargo, Turing recomendará un salario en el que estamos seguros de que podemos encontrarle una oportunidad fructífera y a largo plazo. Nuestras recomendaciones se basan en nuestra evaluación de las condiciones del mercado, así como en la demanda de los clientes.

Preguntas Frecuentes

Somos una plataforma de empleos de largo plazo basada en Palo Alto California que permite a los desarrolladores de software más talentosos del mundo trabajar con las mejores empresas estadounidenses desde la comodidad de sus hogares. Nuestros directivos Jonathan Siddharth y Vijay Krishnan son ex-alumnos de Stanford y exitosos emprendedores de IA.

Después de cargar tu currículum, tendrás que pasar por tres pruebas: una evaluación de experiencia, una breve prueba de tus stacks tecnológicos y un desafío de programación en vivo. Una vez que pases estas pruebas, estarás listo para aplicar a una amplia gama de trabajos disponibles según tus habilidades.

No necesitas pagar ningún impuesto en los Estados Unidos. Sin embargo, es posible que debas pagar impuestos de acuerdo con las leyes fiscales de tu país. Además, tu banco podría cobrarte una pequeña comisión al depositar en tu moneda local.

En Turing, contratamos desarrolladores remotos en más de 100 tecnologías como React/Node, Python, Angular, Swift, React Native, Android, Java, Rails, Golang, PHP, Vue, entre otras. Además de ello, consideramos la experiencia laborar previa.

La comunicación es crucial para el éxito cuando se trabaja con clientes estadounidenses. Preferimos candidatos con un nivel B1 de inglés, es decir, aquellos que tienen la fluidez necesaria para comunicarse de manera oral y escrita sin problemas con nuestros clientes y hablantes nativos.

Actualmente, contamos solamente con vacantes para desarrolladores debido a la demanda de nuestros clientes. Es posible que en el futuro expandamos nuestra oferta a otros roles. Consulta frecuentemente nuestra página de carreras, puede ser que encuentres una posición que se adapte a tus habilidades y experiencia.

Nuestra diferenciación exclusiva radica en la combinación de nuestro modelo de negocio principal y nuestros valores. Para el avance de la AGI, Turing ofrece oportunidades de contratos temporales. La mayoría de los contratos para Consultores de IA tienen una duración máxima de 3 meses, con posibilidad de prórrogas mensuales — condicionadas a su interés, disponibilidad y a la demanda del cliente — hasta un máximo de 10 meses consecutivos. Para nuestro negocio Turing Intelligence, ofrecemos proyectos a largo plazo y de jornada completa.

No, el servicio es absolutamente gratuito para los desarrolladores de software que se registren.

Idealmente, un desarrollador remoto debe tener al menos 3 años de experiencia relevante para ser contratado por Turing, sin embargo, no cerramos las puertas a desarrolladores excepcionales. Realiza nuestras pruebas para averiguar si podemos ofrecerte alguna oportunidad emocionante.

Ver más preguntas frecuentes

Últimas entradas de Turing

Turing.com-Salary-Review

Turing Reviews: ‘The Compensation I Get At Turing Is Better than What I Could Get in Moscow'

Russian Data Science expert shares his Turing.com review on remote software jobs, working culture, salary, work-l...

Leer más
Software-developer-jobs-in-Silicon-Valley-tech-companies

Looking for Software Developer Jobs? Learn How to Write a Clean Code First

Are you a software developer looking for remote jobs in Silicon Valley tech companies? If yes, these clean code t...

Leer más
Sam Good- Turing.com Review

‘Turing Is a Fantastic Place to Be with a Lot of Really Cool People,’ Says Sam from the US!

Turing is a great place to be with a lot of really cool people, says Sam from the United States in his Turing.com...

Leer más
Software-Development-Life-Cycle-scaled

The Nine Steps of Software Product Development Life Cycle

A product development process depends on the nature of the business. But these steps can turn your ordinary softw...

Leer más

Liderazgo

En pocas palabras, Turing tiene como objetivo hacer que el mundo tenga igualdad de oportunidades. Turing fue fundada por los empresarios seriales de IA Jonathan y Vijay, cuya empresa anterior de IA (vendida con éxito) fue impulsada por un talento remoto excepcional. Turing tambien es respaldada por inversionistas innovadores de alto perfil como el primer CTO de Facebook (Adam D'Angelo), ejecutivos de Google, Amazon, Twitter y Foundation Capital.

Política de Igualdad de Oportunidades

Turing es un empleador que ofrece igualdad de oportunidades. Turing prohíbe la discriminación y el acoso de cualquier tipo y ofrece igualdad de oportunidades de trabajo a los empleados y solicitantes sin tener en cuenta la raza, el color, la religión, el sexo, la orientación sexual, la identidad o expresión de género, la edad, el estado de discapacidad, el estado de veterano protegido o cualquier otra característica protegida por la ley.

Explora trabajos remotos de desarrollador

briefcase
AI Quality Analyst - Portuguese (Portugal)

About Turing:
Based in San Francisco, California, Turing is the world’s leading research accelerator for frontier AI labs and a trusted partner for global enterprises deploying advanced AI systems. Turing supports customers in two ways: first, by accelerating frontier research with high-quality data, advanced training pipelines, plus top AI researchers who specialize in coding, reasoning, STEM, multilinguality, multimodality, and agents; and second, by applying that expertise to help enterprises transform AI from proof of concept into proprietary intelligence with systems that perform reliably, deliver measurable impact, and drive lasting results on the P&L.

Role Overview:

As an AI Quality Analyst, you will evaluate a new personalization feature for Gemini. You will assess how well the model uses information from your past Gemini conversations, Gmail, Google Search, and YouTube activity to make responses more relevant and helpful. This role requires a unique blend of creativity and analytical rigor. You will actively design prompts from the perspective of your own personal experiences. You will then use your analytical skills to assess the quality of the model's personalized responses, evaluating dimensions like Grounding, Integration, and Helpfulness.


Key Qualifications

  • Portugueese Proficiency: Ability to read and write in Portuguese with a high degree of comp, as Portuguese is the focus language for this project.
  • Personal Account Usage: Willingness to use your primary personal Google account (not a testing account) and enable personal data sources for a genuine assessment.
  • Schedule Flexibility: Full-time availability in your local time zone is required.  We are staffing a global, 24-hour operations team.
  • Exceptional Analytical Thinking: Demonstrate ability to evaluate nuanced and ambiguous AI responses, specifically assessing personalization quality.
  • Creative Prompt Engineering: Experience in designing creative, multi-turn starting prompts based on personal context to thoroughly test the model's capabilities.
  • Strong Evaluation Acumen: Understanding of personalization concepts, including the ability to identify incorrect personalization, poor inferences, and forced connections.
  • Meticulous Attention to Detail: The ability to review Side-by-Side (SxS) model responses and spot subtle differences in naturalness and overnarrating.
  • Excellent Written Communication: Superior ability to write clear, concise, and structured rationales for model rankings, explicitly referencing specific turn numbers.
  • Feedback: Ability to provide constructive feedback and detailed annotations.
  • Communication: Excellent communication and collaboration skills.
  • Independence: Self-motivated and able to work independently in a remote setting.
  • Technical Setup: Desktop/Laptop set up with a good internet connection.


Description:

  • In this role, you will be part of a dynamic team focused on evaluating the quality of personalized AI interactions. Your day-to-day work will involve:
  • Designing and executing multi-turn conversational prompts (typically 1-5 turns) that require the AI to utilize your personal information and experiences.
  • Evaluating model responses based on your intent from the starting prompt, checking if the personalization was appropriately applied.
  • Analyzing responses for Grounding issues, ensuring claims about you are supported by evidence and not flawed inferences or hallucinations.
  • Assessing Integration quality to ensure personal data is woven naturally into the response without robotic "overnarrating".
  • Rigorously evaluating and stack-ranking two model responses side-by-side (SxS) to determine which is overall more helpful, easy to use, and enjoyable.
  • Writing clear, defensible rationales for your comparisons, explicitly referencing where issues or positive aspects occurred in the conversation.
  • Extracting and verifying "Debug Info" from the model to confirm that chat summaries and data sources were properly utilized.
  • Maintaining strict data hygiene by deleting evaluation conversations to prevent them from polluting your future chat history.


Education & Experience

  • BS/BA degree or equivalent experience in a relevant field (e.g., Policy, Law, Ethics, Linguistics, Journalism, Computer Science, or a related analytical field).
  • Experience in data annotation, AI quality evaluation, content moderation, or a related role is strongly preferred.

Offer Details:

  • Commitments Required: at least 4 hours per day and upto 40 hours per week with 4 hours of overlap with PST.
  • Engagement type: Contractor
  • Engagement Length: 3 months
  • Our offered rate for this project is $15 per hour.

Evaluation Process -

  • Shortlisted candidates will be sent a Job Interest Form.
  • After the profile review, an assessment will be shared, which must be completed within 24 hours.
  • Based on the assessment outcomes, shortlisted candidates will be contacted to discuss the pre‑onboarding requirements.
Software
10K+ employees
Domain-Specific Languages
briefcase
AI Engineer

About Turing


Based in San Francisco, California, Turing is the world’s leading research accelerator for frontier AI labs and a trusted partner for global enterprises deploying advanced AI systems. Turing supports customers in two ways: first, by accelerating frontier research with high-quality data, advanced training pipelines, plus top AI researchers who specialize in coding, reasoning, STEM, multilinguality, multimodality, and agents; and second, by applying that expertise to help enterprises transform AI from proof of concept into proprietary intelligence with systems that perform reliably, deliver measurable impact, and drive lasting results on the P&L


Role Overview


We are looking for an AI/ML Engineer specializing in LLM post-training and reinforcement learning workflows. The role focuses on fine-tuning open-weight models, building reward systems, and improving model performance through scalable training, evaluation, and data curation


What does day-to-day life look like?

  • Design and execute fine-tuning pipelines for open-weight models (Qwen, Llama, Mistral families) using SFT → DPO → GRPO progressions on tool-use and agentic data.
  • Implement and tune LoRA / QLoRA adapters for parameter-efficient fine-tuning; understand when full fine-tuning vs PEFT is the right call.
  • Build reward functions and verifiers for RL training  including programmatic verifiers, LLM-as-judge rubrics, and state-transition checks against gym environments.
  • Generate, curate, and filter RL tool-use training data: golden trajectories, preference pairs, on-policy rollouts, and rejection-sampled completions.
  • Run distributed training on multi-GPU setups; manage inference at scale with vLLM (including extended-context configurations via YaRN / RoPE scaling).
  • Diagnose failure modes: reward hacking, distribution collapse, KL blow-up, tool-selection errors vs state-transition errors, format drift.
  • Define and track evaluation metrics  pass@k, pass^k, trajectory-level scoring, rubric-based vs binary scoring  and own model-quality reporting against benchmarks.
  • Partner with annotation, eval, and client teams to translate data-quality signals into training improvements.

Requirements

  • 3+ years of hands-on ML engineering experience, with at least 1+ year specifically on LLM post-training.
  • Demonstrated production or research experience with at least three of: SFT, LoRA/QLoRA, DPO, PPO, GRPO, RLHF.
  • Strong PyTorch fundamentals; working familiarity with Hugging Face TRL, Accelerate, DeepSpeed or FSDP, and vLLM.
  • Experience designing reward signals or verifiers for RL training  not just running training scripts.
  • Solid grasp of tokenization, attention, chat templates, tool-calling formats (OpenAI/Anthropic-style), and common failure modes in agent training.
  • Comfort with Python, distributed training, GPU profiling, and reading research papers and turning them into working code.

Strongly Preferred:


  • Experience training tool-use or agentic models (function calling, multi-step tool selection, planner-executor patterns).
  • Experience with synthetic data generation pipelines and rejection sampling.
  • Familiarity with MCP, LangChain/LangGraph, or similar agent frameworks.
  • Exposure to evals at scale: building harnesses, designing rubrics, dealing with judge variance and reward hacking.
  • Cloud/infra: RunPod, AWS, GCP; container workflows; long-context inference tuning.


Perks of Freelancing With Turing

  • Work in a fully remote environment.
  • Opportunity to work on cutting-edge AI projects with leading LLM companies.

Offer Details

  • Commitments Required: 40 hours per week with overlap of 4 hours with PST. 
  • Engagement Type: Contractor assignment (no medical/paid leave)
  • Duration of contract : 2 months; [expected start date is next week]
  • Location: India, Pakistan, Bangladesh, Brazil

Evaluation Process

  • 2 rounds of Technical Interview (90 mins)
-
1-10 employees
PythonMachine Learning
sample card

Aplica a los mejores trabajos

Ver más vacantes
Turing books $87M at a $1.1B valuation to help source, hire and manage engineers remotely
Turing named one of America's Best Startup Employers for 2022 by Forbes
Ranked no. 1 in The Information’s "50 Most Promising Startups of 2021" in the B2B category
Turing named to Fast Company's World's Most Innovative Companies 2021 for placing remote devs at top firms via AI-powered vetting
Turing helps entrepreneurs tap into the global talent pool to hire elite, pre-vetted remote engineers at the push of a button

Trabaje con las principales empresas del mundo

Crea tu perfil, pasa las pruebas de Turing y recibe ofertas de trabajo dos semanas después.