Nhân sự ngành data – Thực tế họ làm gì?

Nội dung

Hiện nay, thị trường tuyển dụng trong ngành Data rất nhộn nhịp. Ngay cả ở Việt Nam, các khóa học 03-06 tháng Data Analyst mọc ra khắp nơi. Với lời nói các công ty sẽ luôn cần tới Data, do đó các công việc DA sẽ luôn có vị trí mới. Thực tế có đúng như thế không?

Ngoài ra, nếu bạn quan tâm tới lĩnh vực thì có thể bạn cũng đã nghe tới các vị trí khác về Data như: Data Engineer, Data Scientist, Machine Learning Engineer… Bài viết này sẽ giải thích và phân biệt các vị trí đấy thực tế sẽ như thế nào. Để qua đó giúp các bạn hiểu rõ định hướng nghề Data và lựa chọn vị trí phù hợp nhé.

Data Analyst

data analyst làm gì
Data Analyst

Giới thiệu

Data Analysts phụ trách các công việc bao gồm: tổng hợp dữ liệu(data aggregation), xử lý và xây dựng các data theo nghiệp vụ (data modeling), xây dựng báo cáo (data reporting) và trực quan hóa dữ liệu (data visualization), khai thác dữ liệu (data exploration).

Các Data Analysts thường sẽ sử dụng SQL để tổng hợp dữ liệu từ một hoặc nhiều cơ sở dữ liệu(do kiến trúc kỹ thuật mỗi công ty khác nhau) để xuất ra báo cáo. Ngoài ra, DA còn hỗ trợ kinh doanh bằng cách tìm kiếm các đặc tính (pattern) và xu hướng (trend) của dữ liệu trong quá khứ.

Ví dụ: DA sẽ tổng hợp dữ liệu bán hàng thành các báo cáo dựa trên các chỉ số được thống nhất với bộ phận kinh doanh như: giá trị trung bình đơn hàng, tổng doanh thu ròng, số lượng khách hàng… Đồng thời DA sẽ đưa ra các sự thật (fact) kết hợp với kiến thức chuyên ngành (domain knowledge) để cho ra hiểu biết với tập dữ liệu đó (insight).

Làm sao để trở thành Data Analyst

Các kỹ năng cứng cần thiết

  • Mức độ thành tạo SQL, và mức độ sử dụng được đối với Python để xử lý các tác vụ đơn giản.
  • Có kinh nghiệm sử dụng các công cụ Visualization như: Apache Superset, Tableau, Google Data Studio.
  • Xây dựng được các mẫu báo cáo, dựng dashboard từ SQL và các công cụ Visualization trên.
  • Có kiến thức vững về thống kê.

Các kỹ năng mềm

  • Kỹ năng làm việc nhóm, vì luôn làm phải là đầu mối với các team khác.
  • Khả năng sắp xếp và quản lý, vì bạn sẽ là người bị request rất nhiều từ các team khác.
  • Khả năng thuyết trình, trình bày vấn đề.
  • Hiểu biết kiến thức chuyên ngành (domain knowledge, kỹ năng này được xếp ở đây vì Data Analyst là vị trí đa ngành, tuỳ tổ chức mà có kiến thức khác nhau).

Data Engineer

Data Engineer làm gì
Data Engineer

Giới thiệu

Data Engineers phụ trách các công việc bao gồm: xây dựng hệ thống và kiến trúc cho data, xây dựng các đầu thu thập dữ liệu (data pipeline) với dữ liệu từ các database khác, dữ liệu từ các phần mềm bắn về, dữ liệu từ files, dữ liệu đối tác v.v, lưu trữ dữ liệu theo nhu cầu theo mức truy cập ngay và tạm chưa dùng, cung cấp dữ liệu cho các team và phòng ban khác.

Data Engineers có khả năng xây dựng, kiểm tra các hệ thống dữ liệu lớn, đảm bảo dữ liệu được lưu trữ, sử dụng nhanh chóng và hiệu quả theo các yêu cầu. Vị trí này sẽ làm việc chặt chẽ với các Data Scientist và Analyst để cung cấp cho họ dữ liệu cần thiết để thực hiện công việc của mình.

Vị trí này thường đòi hỏi một lượng lớn kiến thức và kỹ năng chuyên ngành. Tuỳ theo tình hình mỗi tổ chức, vị trí này có thể phải đưa ra các giải pháp dữ liệu phù hợp. Ví dụ một số tổ chức có lượng data không nhiều (nhưng chất lượng) thì chỉ cần giải pháp là PostgreSQL và các ETL tools. Và có tổ chức có lượng dữ liệu khổng lồ tính bằng TB thì lúc này cần những công cụ phù hợp.

Làm sao để trở thành Data Engineer

Các kỹ năng cứng cần thiết

  • Thông thạo ít nhất một trong các ngôn ngữ sau: Java, Python, R, Scala, NodeJs.
  • Thông thạo ít nhất một trong các RDBMS sau: PostgreSQL, MySQL, SQLServer, Oracle.
  • Thông thạo một trong các ETL tools như: Apache Nifi, Airbyte, AWS Glue, Google Cloud DataFlow, Apache Flink
  • Có khả năng xây dựng hệ thống, kết nối hệ thống, có khả năng thiết kế model dữ liệu.
  • Có kinh nghiệm ít nhất một trong các NoSQL sau: MongoDB, Redis, ElasticSearch, Hive, Apache Kafka.
  • Có kinh nghiệm về Linux, Docker.

Các kỹ năng mềm

  • Quản lý và sắp xếp thông tin, Data Engineer lưu trữ rất nhiều thông tin liên quan tới hệ thống, nếu không có thói quen sắp xếp thì sẽ bị “lạc lối” trong tương lai gần.
  • Khả năng làm việc nhóm, trao đổi thông tin.

Data Science

Data Scientist làm gì
Data Scientist

Giới thiệu

Data Scientist phụ trách các vấn đề về nghiên cứu dữ liệu bao gồm: chuẩn bị, làm sạch và xây dựng các bộ dữ liệu (dataset) dựa trên raw data (tương tự như Data Engineer), rút trích đặc tính và xu hướng của tệp dữ liệu hiện hành (tương tự như Data Analyst), tạo dựng các thuật toán dự báo (forecasting) từ các công cụ và phương pháp thích hợp, trao đổi với các phòng ban để có thể xây dựng các dự án data khả thi và có giá trị cho tổ chức (data product), nghiên cứu, xây dựng và triển khai mô hình máy học (machine learning).

Data Science là vị trí về nghiên cứu dữ liệu để trích xuất những hiểu biết (insight) có ý nghĩa cho tổ chức. Đó là một vị trí tiếp cận đa ngành kết hợp các nguyên tắc và thực tiễn từ các lĩnh vực toán học, thống kê, trí tuệ nhân tạo và khoa học máy tính để phân tích lượng dữ liệu lớn (Big data). Các phân tích này giúp bộ phận liên quan đặt và trả lời các câu hỏi như chuyện gì đã xảy ra, tại sao nó xảy ra, điều gì sẽ xảy ra và có thể làm gì với kết quả đó.

Ví dụ công ty bạn là một công ty về công nghệ, sản phẩm chủ chốt là Software as a Service (SaaS). Để tăng doanh thu cho công ty, CEO/CTO đã tuyển bạn về. Vì bạn là một Data Science, cách tiếp cận của bạn là nghiên cứu dữ liệu, trò chuyện với các phòng ban khác, để tháo gỡ nút thắt hoặc xây dựng một sản phẩm AI/ML nào đó để giúp khách hàng của bạn dễ dàng sử dụng hơn, và qua đó tăng thêm doanh thu.

Làm sao để trở thành Data Science

Các kỹ năng cứng cần thiết

  • Thông thạo ít nhất một trong các ngôn ngữ sau: Python, R, Java.
  • Các phương pháp phân tích thống kê: trị trung bình, độ lệch chuẩn(standard deviation), phân tích hồi quy (Regression analysis), kiểm tra giả thuyết (hypothesis testing)…
  • Có khả năng xây dựng và triển khai các mô hình máy học (Machine Learning): Supervised Learning , Unsupervised Learning…
  • Thông thạo ít nhất một trong các RDBMS sau: PostgreSQL, ClickHouse, Redshift… và/hoặc có kinh nghiệm với NoSQL như Hive, BigQuery, HDFS/Spark…
  • Có kinh nghiệm về Linux, Docker…

Các kỹ năng mềm

  • Khả năng nắm bắt vấn đề cốt lõi, logic tốt, đồng thời phản biện để xây dựng.
  • Khả năng làm việc nhóm, trao đổi thông tin, cũng như thấu cảm góc nhìn của người khác. Vì phải đi đôi giày của người khác thì mới hiểu họ cần gì.
  • Khả năng xây dựng dự án và quản lý dự án.

Machine Learning Engineer

Machine Learning Engineer làm gì
Machine Learning Engineer

Giới thiệu

Machine learning Engineers đã và sẽ được tuyển dụng ngày càng nhiều, đặc biệt là sau “cơn địa chấn” chatGPT. Tuy nhiên, vị trí này đòi hỏi rất nhiều kỹ năng khác nhau về công nghệ lẫn các phương thức đánh giá khoa học dựa trên thống kê. Vì việc đưa một dự án AI là còn quá mới mẻ đối với các tổ chức, thậm chí ngay cả các tập đoàn lớn. Nên mọi bước đi của một dự án AI đều cần vị trí này ít nhiều sẽ tham gia vào.

Vị trí này sẽ chịu trách nhiệm ở các khâu: xây dựng, kiểm tra thuật toán AI, được chạy trên tập dữ liệu hiện hành để tạo ra các mô hình máy học (training data for machine learning models), đánh giá và cải tiến mô hình (evaluate & improve models), triển khai mô hình lên môi trường thực tế, đồng thời bảo trì hệ thống.

Ví dụ: một vị trí Machine Learning Engineer sẽ phải nghiên cứu, tạo ra mô hình cho một tác vụ về khuyến nghị một sản phẩm cho người dùng (Recommendation), đồng thời đưa mô hình này lên môi trường thực tế để người dùng trải nghiệm, và thu thập thêm dữ liệu trong quá trình chạy để đánh giá và cải tiến mô hình.

Làm sao để trở thành Machine Learning Engineer

Các kỹ năng cứng cần thiết

  • Thông thạo các ngôn ngữ sau: Python, Java, NodeJs, Go. Các vị trí này luôn cần phải có ngôn ngữ để các dịch vụ software có thể tương tác với mô hình.
  • Toán học ứng dụng: xác suất, thống kê, đại số tuyến tính.
  • Các thuật toán trong Machine Learning như: Naïve Bayes Classifier, K Means Clustering, Decision Trees, Apriori Algorithm, Linear Regression…
  • Một số công cụ phục vụ cho AI/ML: như SparkML, TensorFlow, Sklearn…

Các kỹ năng mềm

  • Khả năng trao đổi thông tin. Vị trí này là một vị trí rất mới và phức tạp, nên cần khả năng truyền đạt thông tin tốt cả hai chiều, gồm lắng nghe và nói để cho cả người trong và ngoài ngành đều hiểu được.
  • Khả năng làm việc nhóm, thích nghi đội nhóm, đặc biệt là trong đội ngũ sẽ có người trong và ngoài ngành.
  • Hiểu được đặc điểm ngành đang làm, luôn cần có. Mọi mô hình đều sai, chỉ có vài mô hình là sử dụng được.

Data Governance/Management Specialist

Data Governance làm gì
Data Governance

Giới thiệu

Một nhân sự Data Governance/Management sẽ đảm đương các công việc: nhận và lưu trữ thông tin các tập dữ liệu (metadata keep tracking), nhận và lưu trữ đường đi của dữ liệu (data lineage) khi dữ liệu được tạo ra và xây dựng bởi các bộ phân, tạo và ban hành chính sách sử dụng dữ liệu (data policy), hướng dẫn các team nơi lấy dữ liệu đúng với nhu cầu của team đó, thu thập và lưu trữ các định nghĩa (terms and glossaries) từ các phòng ban.

Đây là một vị trí còn rất mới và trong thị trường tuyển dụng vẫn còn rất ít các vị trí như thế này. Tuy nhiên, theo đánh giá của mình thì đây nên là một trong các vị trí quan trọng cần phải có trong team Data khi số lượng nhân sự ở khối Back-Office lên hơn 50 người.

Lý do: khi khối Back-Office hơn 50 người, đồng nghĩa với khối Front-Office ít nhất phải gấp đôi số này. Như vậy để dữ liệu có thể được sử dụng một cách hiệu quả thì cần hẳn một vị trí có thể làm được các công việc trên, để dữ liệu có thể đến đúng nơi, nhanh và chính xác.

Làm sao để trở thành Data Governance/Management Specialist

Các kỹ năng cứng cần thiết

  • Điều đầu tiên là luôn cần phải biết Excel, Words.
  • Có kinh nghiệm triển khai các công cụ về data management như: Data Hub, Amundsen, Metacat, Apache Atlas…
  • Có thể biết các tools documentation khác như: Notion, Jira.

Các kỹ năng mềm

  • Khả năng sắp xếp và lưu trữ thông tin, rất quan trọng vì vị trí này sẽ luôn phải nhận thông tin và sắp xếp vào kho như một thủ thư.
  • Khả năng trao đổi thông tin, khả năng làm việc nhóm.
  • Khả năng định hướng, hướng dẫn, phân luồng thông tin tới các bộ phận cần.
  • Khả năng hoạch định chính sách và đảm bảo chính sách hoạt động đúng.

Lưu ý: vị trí này khá phù hợp với các bạn từ các vị trí như Sales Admin, Kế Toán, Nhân sự, Đào tạo nội bộ mong muốn chuyên qua lĩnh vực data. Nhưng chưa có các kỹ năng như đã đề cập ở các vị trí ở trên. Tuy nhiên vẫn có một khúc mắc là nhu cầu tuyển dụng vẫn còn rất ít ở vị trí này. Bản thân mình cũng hy vọng vị trí này sẽ được quan tâm nhiều hơn trong tương lai.

Tóm tắt

Nhìn chung lĩnh vực data và AI vẫn còn khá mới mẻ với phần lớn tổ chức và doanh nghiệp. Qua bài viết này mình hy vọng sẽ giúp các bạn trẻ định hướng được xu hướng ngành ở vị trí hiện tại.

Có thể trong tương lai không xa, các vị trí này sẽ có thể thay đổi về tính chuyên môn hóa hơn. Tuy nhiên những kiến thức căn bản vẫn không bao giờ mất đi, hy vọng các bạn chuẩn bị cho mình một hành trang kiến thức đúng đắn.

Có một kỹ năng mềm mà bất cứ ngành nào cũng sẽ cần: “Đừng bỏ cuộc”

Stay hungry stay foolish!

Steve Jobs

Bài viết liên quan

SQL trong Data Analysis: Procedure và Function – 2 công cụ không thể thiếu

Xin chào các bạn đã quay trở lại chuỗi bài SQL trong Data Analysis...

Tự học Data Analyst: Tổng hợp chuỗi bài SQL 101 trong Data Analysis

Trong bài viết này, chúng ta sẽ tổng hợp các bài viết thành một...

SQL trong Data Analysis: Hiểu rõ và ứng dụng đệ quy (Recursive trong PostgreSQL)

Trong thế giới của cơ sở dữ liệu quan hệ, các truy vấn đệ...

[Phân Tích Dữ Liệu Với Python] Tập 1: Làm Quen Với Pandas

Trong thời đại tiến bộ của khoa học dữ liệu, khả năng phân tích...
spot_img