Senior Data Platform Engineer / Ingénieur de plateforme de données sénior
Local Logic
Our Mission
Local Logic is digitizing the built world to make it universally understandable and actionable for consumers, investors, developers, and governments with the ambition of helping build cities that are more sustainable and equitable for the people who live in them.
To achieve that dream, we’ve built a digital twin of cities, quantifying the built world using data and AI to interpret the $217T real estate market throughout the US and Canada.
We started our journey at McGill University’s urban planning department, where we came to see that cities were being developed in all kinds of unsustainable ways. Why were sprawling suburbs still being built, when doing so would increase pollution and inequality? Why were new business parks being built far from mass transit, when doing so would make traffic congestion skyrocket? Why was social housing being built in places that would exacerbate social problems rather than improve them?
It became clear to us why: cities are incredibly difficult to understand. However, we realized that with recent advances in data science, all the complexity of cities could be made simple enough for anyone to understand. And that understanding would be essential to making the sustainable, equitable, and prosperous cities that we so desperately need.
Today, Local Logic delivers sophisticated location insights through webtools, APIs, one-click reports and a data analytics platform. Our insights are powered by billions of data points we’ve generated that describe all aspects of cities -- from the distance to the nearest bus stop, the quietness on the street, to the most recent trends in the housing market and more.
Your Mission
As Local Logic’s Senior Data Platform Engineer, you will help evolve our batch-heavy data platform that powers large-scale geospatial processing and time-driven production pipelines (daily, monthly, and quarterly refresh cycles), used to create our location-based insights & predictions from large and diverse sources of data. Our data platform delivers value to our customers through public APIs serving over 400M monthly calls, customer-facing SDKs, and our team of Data Scientists. The ideal candidate will have a strong background in data engineering, geospatial data at scale, and cloud-based technologies, and is motivated to continuously deepen their expertise as our data platform evolves in scale and complexity.
You believe in our mission and want to help us achieve it. You bring your own unique perspective to the team, so you can challenge the way we do things for the better. You’re able to speak up when you disagree, ask questions when you don’t understand, and take ownership of your work.
As a Senior Data Platform Engineer in the Data team, your responsibilities will include:
- Pipeline Development & Operations: Design, build, and operate large-scale, time-driven batch pipelines and lakehouse datasets, totalling about 30TB, powering production APIs and machine learning systems. Ensure reliability, cost-efficiency, reproducibility, and predictable data refresh cycles across daily, monthly, and quarterly workloads.
- Cross-Functional Enablement: Work closely with data scientists, machine learning specialists and software developers and technical product managers to translate their requirements into data architecture.
- Governance & Quality: Define and implement best practices for data management, quality, and governance, to ensure data quality, accuracy, and consistency for the team. This includes, but is not limited to, schema versioning, data validation frameworks, monitoring & alerting and data lineage.
- Technical Leadership & Mentorship: Champion software development best practices and standards for performance, quality assurance, testing, security and coding quality through code reviews, design reviews and by defining architectural standards.
Key Requirements:
- Proven ability to design, build, operate, and optimize production-grade batch data pipelines and lakehouse datasets at scale, including data modeling, orchestration, observability, and cost management.
- Strong software engineering proficiency in Python, including writing modular, testable, and production-ready code.
- Experience integrating batch data pipelines with production databases, ensuring data integrity, consistency, and efficient write patterns.
- Production experience operating data systems in cloud-native environments, with an understanding of containerization, infrastructure-as-code, and distributed compute patterns. Experience with AWS and Kubernetes is a plus.
- Experience working with large-scale geospatial datasets, spatial indexing, or geospatial analytics workflows is highly valued.
- Experience implementing CI/CD practices for data and application workflows, including automated testing and deployment pipelines.
- Experience designing and operating production-grade asset-based workflows in Dagster (or similar modern orchestrators).
- Excellent interpersonal and communication skills.
- Startup mindset: Ability to embrace change, adapt to shifting priorities and take ownership when required.
- This position is for hybrid work in Montreal, with an expectation of 2-3 days per week in office.
Technologies We Use
- Data Processing & Orchestration
- Python (with Polars, Pandas and Pyspark)
- Dagster (asset-based orchestration)
- DuckDB
- Storage & Data Formats
- Parquet
- Delta Lake (Delta tables)
- AWS S3
- Production Data Stores
- Postgres
- DynamoDB
- Distributed & Cloud Infrastructure
- AWS / AWS CDK
- Docker
- Kubernetes
- Databricks
- Spark
- CI/CD & Tooling
- GitHub Actions
- CircleCI
- Github Copilot and other Coding Agents
Why Should You Work Here?
At Local Logic, you have an amazing opportunity to be an early team member of a Series B backed startup. We are focused on understanding the world and its cities to predict the future and make the real estate market more transparent.
We are a people-first company that strives to create the best experience for our employees by creating an inclusive, collaborative, challenging environment to learn and problem-solve on a daily basis.
You will have access to benefits such as:
- Comprehensive health insurance on us
- A health platform (telemedicine, Employee and Family Assistance Program (EFAP), mental health and stress management assistance) (*for Canadians only)
- Stock options
- Unlimited vacation
- Intentional Fridays
- Health and benefit allowance per year
- Initial WFH allowance
- Bike sharing membership on us
- A cool office in the heart of Montreal
Your professional development is our priority. With a 1500 CAD annual professional development credit you’re encouraged to keep learning, explore new skills, and advance in your career. We want you to thrive, grow, and feel fulfilled while working on work that matters. Join us, and help us build a brighter future for cities around the world.
Our Commitment to Diversity & Inclusion
We’re aiming to build a diverse team and inclusive company culture. We are an equal opportunity employer (EOE) and do not discriminate based on race, color, ethnicity, ancestry, national origin, religion, sex, gender identity, gender expression, sexual orientation, age, disability, veteran status, genetic information, marital status or any legally protected status.
[En Français]
Notre Mission
Chez Local Logic, notre mission est d'améliorer toutes les décisions immobilières, qu'il s'agisse des consommateurs à la recherche d'un quartier qui correspond à leur style de vie, des investisseurs qui cherchent à repérer les meilleurs emplacements à développer, ou des gouvernements locaux qui s'efforcent de construire des villes plus durables grâce à une meilleure planification urbaine.
Nous avons commencé notre parcours au département d'urbanisme de l'université McGill, où nous avons constaté que les villes se développaient de toutes sortes de manières non durables. Pourquoi continuer à construire des banlieues tentaculaires, alors que cela a pour effet d'accroître la pollution et les inégalités ? Pourquoi de nouvelles zones d'activités sont-elles construites loin des transports en commun, alors que cela fait exploser les embouteillages ? Pourquoi les logements sociaux sont-ils construits dans des endroits qui exacerbent les problèmes sociaux au lieu de les améliorer ?
Nous avons compris pourquoi : Les villes sont incroyablement difficiles à comprendre. Mais, nous avons réalisé qu'avec les progrès récents de la science des données, toute la complexité des villes peut être simplifiée pour que n'importe qui puisse la comprendre. Cette compréhension est essentielle pour créer des villes durables, équitables et prospères dont nous avons désespérément besoin.
Aujourd'hui, notre vaste ensemble de plus de 100 milliards de points de données fournit des informations et des analyses inégalées qui ont influencé des transactions immobilières d'une valeur de plusieurs milliards de dollars et qui aident en permanence plus de 15 millions d'utilisateurs mensuels, sur 8 000 sites web aux États-Unis et au Canada, à prendre des décisions plus éclairées.
Votre Mission
En tant qu’ingénieur(e) de plateforme données senior, vous serez responsable de contributions clés à la prochaine génération de notre plateforme de données, utilisée pour créer nos analyses et prédictions basées sur la géolocalisation à partir de grandes et diverses sources de données. Notre plateforme apporte de la valeur à nos clients à travers des API publiques répondant à plus de 400 millions d’appels mensuels, des kits de développement logiciel destinés aux clients, et également notre équipe de scientifiques de données. La candidate ou le candidat idéal aura une solide expérience en ingénierie des donnée, en gestion des données géospatiales à grande échelle, en technologies infonuagiques et est motivé à approfondir son expertise à mesure où notre plateforme de données évolue en taille et en complexité.
Vous croyez en notre mission et souhaitez nous aider à l'accomplir. Vous apportez votre perspective unique à l'équipe, ce qui vous permet de remettre en question nos méthodes pour les améliorer. Vous êtes capable de prendre la parole lorsque vous êtes en désaccord, de poser des questions lorsque vous ne comprenez pas, et de prendre la responsabilité de votre travail.
En tant qu’ingénieur(e) de données senior, les responsabilités incluent:
- Développement de pipelines et opérations: Concevoir, construire et opérer des pipelines par lots à grande échelle et synchronisés, ainsi que des ensembles de données “Lakehouse”, totalisant environ 30To, qui alimentent les API de production et les systèmes d'apprentissage automatique. Assurer la fiabilité, la rentabilité, la reproductibilité et la prévisibilité des cycles d'actualisation des données pour les charges de travail quotidiennes, mensuelles et trimestrielles.
- Facilitation interfonctionnelle: Travailler en étroite collaboration avec les scientifiques des données, les spécialistes en apprentissage automatique, les développeurs de logiciels et les chefs de produit techniques afin de traduire leurs exigences en architecture de données.
- Gouvernance et qualité: Définir et mettre en œuvre les meilleures pratiques en matière de gestion, de qualité et de gouvernance des données afin de garantir la qualité, l'exactitude et la cohérence des données pour l'équipe. Cela comprend, sans s'y limiter, la gestion des versions des schémas, les cadres de validation des données, la surveillance et les alertes, ainsi que la traçabilité des données.
- Leadership technique et mentorat: Promouvoir les meilleures pratiques et normes en matière de développement logiciel pour la performance, l'assurance qualité, les tests, la sécurité et la qualité du code grâce à des revues de code, des revues de conception et la définition de normes architecturales.
Requis clé:
- Capacité avérée à concevoir, construire, exploiter et optimiser à grande échelle des pipelines de données par lots et des ensembles de données “lakehouse” de niveau production, y compris la modélisation des données, l'orchestration, l'observabilité et la gestion des coûts.
- Solides compétences en conception de logiciels en Python, notamment en matière de rédaction de code modulaire, testable et prêt pour la production.
- Expérience dans l'intégration de pipelines de données par lots avec des bases de données de production, garantissant l'intégrité et la cohérence des données, ainsi que des modèles d'écriture efficaces.
- Expérience d’opération de systèmes de données dans des environnements nuagiques natifs, avec une bonne compréhension de la conteneurisation, de l'infrastructure en tant que code et des modèles de calculs distribués. Une expérience avec AWS et Kubernetes est un atout.
- Une expérience dans le domaine des ensembles de données géospatiales à grande échelle, de l'indexation spatiale ou des workflows d'analyse géospatiale a une grande valeur.
- Expérience dans la mise en œuvre de pratiques CI/CD pour les flux de données et d'applications, y compris les pipelines de tests et de déploiements automatisés.
- Expérience dans la conception et l'opération de workflows basés sur des actifs de qualité production dans Dagster (ou des orchestrateurs modernes similaires).
- Excellentes aptitudes relationnelles et communicationnelles.
- Esprit jeune pousse (start-up): capacité à accepter le changement, à s'adapter à l'évolution des priorités et à prendre des initiatives lorsque cela est nécessaire.
- Ce poste est destiné à un travail hybride à Montréal, avec une présence attendue au bureau 2 à 3 jours par semaine.
Technologies que nous utilisons
- Traitement de données et orchestration
- Python (avec Polars, Pandas et Pyspark)
- Dagster (orchestration basée sur des “assets”)
- DuckDB
- Stockage et format des données
- Parquet
- Delta Lake (Delta tables)
- AWS S3
- Magasin de données de production
- Postgres
- DynamoDB
- Infrastructure distribuée et nuagique
- AWS / AWS CDK
- Docker
- Kubernetes
- Databricks
- Spark
- CI/CD et Outils
- GitHub Actions
- CircleCI
- Github Copilot et d’autres agents de codage
Pourquoi travailler ici
Chez Local Logic, vous avez l'opportunité de faire partie de l'équipe d'une jeune pousse, soutenue par sa série B. Nous nous concentrons sur la compréhension du monde et de ses villes pour prédire l'avenir et rendre le marché immobilier plus transparent.
Nous sommes une entreprise qui priorise ses gens et qui s'efforce de créer la meilleure expérience pour ses employés en créant un environnement inclusif, collaboratif et stimulant pour apprendre et résoudre des problèmes au quotidien.
Vous aurez accès à des avantages tels que:
- un régime d’assurance santé, de soins dentaires et de soins oculaires
- des options d'achat d'actions
- une politique de vacances compétitive
- une culture qui met l'accent sur l'apprentissage et l'harmonie entre vie professionnelle et vie privée
- Allocation initiale de travail à domicile
- Vendredis intentionnels
- Abonnement au vélo en libre-service (bixi)
- Un bureau branché au cœur de Montréal
Votre développement professionnel est notre priorité. Grâce à un crédit annuel de 1500 CAD développement professionnel, vous êtes encouragés à continuer d’apprendre, à explorer de nouvelles compétences et à progresser dans votre carrière. Nous voulons que vous vous épanouissiez, que vous progressiez et que vous vous sentiez épanoui tout en travaillant sur des tâches importantes. Rejoignez-nous et aidez-nous à construire un avenir meilleur pour les villes du monde entier.
Notre engagement en faveur de la diversité et de l'inclusion
Nous visons à constituer une équipe diversifiée et une culture d'entreprise inclusive. Nous sommes un employeur souscrivant au principe de l'égalité des chances et ne pratiquons aucune discrimination fondée sur la race, la couleur, l'appartenance ethnique, l'ascendance, l'origine nationale, la religion, le sexe, l'identité ou l'expression sexuelle, l'orientation sexuelle, l'âge, le handicap, le statut de vétéran, les informations génétiques, l'état matrimonial ou tout autre statut protégé par la loi.

