不同行业的工程师和不同行业的工程师平时干的工作不同,使用的工具链不同,需要掌握的专业知识也不同。
比如嵌入式( EE )的软件工程师,根据专业方向不同,可能就要搞网络协议(低于 HTTP 、STMP 这类应用层)、SPI & IIC & CAN 等协议和驱动、搞示波器、搞 LINUX 内核、等等等;
比如 web 后端开发的软件工程师,可能就从 HTTP 协议、到 MVC 框架、到数据库、到一些算法、高并发等等等;
当然还有其它各种的工程师...
上面是我开这个帖子的立意点;
因为自己的工作中的很大一部分会和「数据」打交道;但是算是这一行的入门菜鸟;
所以想听听大佬们说说“数据工程师的世界”;
或者用通俗的自嘲话语:吐槽一下 ETL boy 的生活。(无冒犯之意!!!)
注:(可能不是重点的一个点)我用的编程语言是 Python
大佬们有什么想吐槽,都可以来“灌灌”!
对了,想起来发这个贴子,是因为要做一个「时间」有关的功能;
然后因为时间的表达方式太多了:
所以怎么将这些很不同的表达方式都通过实现的一个“api” 转为(某个) Python 的时间类型就有些困惑;
况且,Python 的时间类型就有好多种:datetime.datetime, time.time, numpy.datetime, pandas.Timestamp, etc...
要转换成哪种作为数据分析时候的 pandas 列呢?又哪种做 SQL 持久化呢?
我想,做一名数据工程师,最基础的就是要和这些 int、float、string、timestamp、datetime、etc... 打交道吧?
1
jimmyismagic 2020-09-24 13:46:46 +08:00
现在真没有几个数据工程师了,尤其是 ETL 的, 要么去做数据分析师,要么去搞深度学习
|
2
oahebky OP |
3
Aksura 2020-09-24 19:48:29 +08:00
不是大佬,也来唠唠。既然是“ETL boy”那就是和数仓打交道了?那么入库的时候,时间字段应该是有统一地转换为一种格式存储的吧?存为 ISO8601,读取的时候再按客户端喜好转换不就行了?
数据工程师一直没有个准确定义吧?看各种 JD,有的公司指的是数据分析、BI 那一类,有的是指大数据开发、数据仓库。 |