数据 infra 人员要求

最匹配画像

云原生数据基础设施工程师
熟 K8s、对象存储、Postgres/OLTP、消息队列/工作流系统、服务可观测性。
做过多租户、配额、限流、回压、容灾、灰度、部署、迁移。
能把数据管线当成“线上系统”而不是“离线任务”来设计。
分布式存储 / 数据库 / 查询系统工程师
理解 WAL、事务、索引、分区、Compaction、LSM/B-Tree、MVCC、一致性、复制、恢复。
不一定真的写过数据库内核，但至少能讲清楚数据库为什么这么设计。
如果做过 Doris、ClickHouse、HBase、TiDB、CockroachDB、StarRocks、Kafka、Flink 内核或存储层，会比纯数仓应用更有价值。
AI/机器人数据平台工程师
做过大文件、多模态数据、视频/传感器/轨迹数据、数据集版本、标注/审核、质量检查、训练数据生产。
熟 S3/MinIO、Parquet/Lance/Delta/Iceberg、元数据管理、数据血缘。
能理解“数据不是表，是资产和生命周期”。

传统数仓候选人的问题

他们常见强项是：

但你这里更需要的是：

所以如果一个人只会“把业务表抽进 Doris，然后建宽表出报表”，确实不太匹配。

你可以把岗位定义成

Cloud-native Data Infrastructure Engineer for embodied AI / robotics data platform.

中文可以叫：

具身智能数据基础设施工程师 / 云原生数据平台工程师 / 多模态数据 Infra 工程师。

不要写成“大数据开发工程师”，否则简历会继续涌入数仓 ETL 人群。

筛选关键词

简历里优先看这些：

Kubernetes / Helm / Terraform / Argo / Prometheus / Grafana
S3 / MinIO / OSS / 对象存储
Postgres / MySQL / distributed database / TiDB / CockroachDB / ClickHouse / Doris kernel
Temporal / Airflow / Dagster / workflow orchestration
Kafka / Pulsar / queue / backpressure
data lake / Iceberg / Delta / Lance / Parquet
schema migration / Alembic / Flyway / Liquibase
multi-tenant / quota / rate limit / isolation
observability / SLO / incident / recovery
robotics / autonomous driving / video data / sensor data / multimodal dataset

面试时重点问