สวัสดีครับ นัชครับ ทำงานอยู่ที่ THiNKNET ทีม Site Reliability Engineer หรือ SRE ครับ ชื่อตำแหน่งอาจไม่แพร่หลายในประเทศไทยสักเท่าไหร่แต่เชื่อไหมว่าทีมนี้มีความนิยมในระดับสากลเป็นอย่างมาก ทีม SRE นี้มีต้นกำเนิดมาจาก Google ในช่วงปี 2003 เป็นทีมที่เกิดจากการรวมคนจากทีม Develop กับ Operations เข้าด้วยกันก่อนที่ความนิยมจะแพร่หลายออกไปในวงกว้างจนมาถึงที่ THiNKNET ของเรา
ลองฟัง IT influencer ชื่อดัง ว่าที่รัฐมนตรี DE and MAGIC อย่าง 9arm
พูดถึงตำแหน่ง SRE สั้น ๆ กันก่อนได้ครับ
ทำความรู้จักกับตำแหน่ง Site Reliability Engineer
Site Reliability Engineer หรือ SRE เป็นทีมที่มีคอยดูแลให้ Platform ทำงานได้ตลอดเวลา ความท้าทายของทีมนี่้คือการป้องกันและแก้ไขปัญหาที่อาจเกิดขึ้นได้ในทุกสถานการณ์ รวมไปถึงการ Optimize ให้สิ่งที่ทำงานได้ดีอยู่แล้วทำได้ดีขึ้นกว่าเดิมด้วย ซึ่งทีม SRE ตั้งอยู่บนความเชื่อที่ว่า "แม้จะมีโอกาสเพียงเล็กน้อยแต่ปัญหาจะเกิดขึ้นแน่นอน" เราไม่อยากให้ User ได้รับประสบการณ์ที่ไม่ดีในการใช้ Platform ของเรา โดยเฉพาะ Platform ที่ User มี Business Value ที่สำคัญมากอย่าง JobThai ทีมนี้จึงเป็นทีมที่มีขึ้นเพื่อป้องกันและลดโอกาสที่จะเกิดปัญหาเหล่านั้นลง รวมถึงการแก้ไขให้ทันท่วงทีหากมีปัญหาเกิดขึ้น
โดยสิ่งที่ทีมนี้ Focus ก็มีอยู่หลายอย่างครับ เช่น
- Availability
- Latency
- Performance
- Efficiency
- Change Management
- Monitoring
- Incident Management
- Capacity Planning
Tech Stack ที่ SRE ต้องใช้
Tech Stack ของทีมนี้ก็มีอยู่หลากหลายเลยครับ มาดูตัวอย่างที่น่าสนใจกัน ว่าที่ THiNKNET เราเลือกใช้อะไรบ้าง
- Infrastucture เช่น AWS, GCP, HWC, On-premise
- Platform เช่น Kubernetes, Docker, Serverless
- Observability เช่น ELK, Prometheus, Jaeger
- Monitoring เช่น Grafana, Uptime Kuma
- CI/CD เช่น Jenkins, ArgoCD
- Backing Storage เช่น MongoDB, RabbitMQ, Elasticsearch, SQL
ทักษะที่จำเป็นสำหรับ SRE (Site Reliability Engineer)
สำหรับ Skills ที่จำเป็นในตำแหน่งนี้จริง ๆ แล้วมีอยู่ไม่เยอะครับ
- Basic Linux
- Networking (Layer 1 - 3)
- DevOps mindset
ซึ่งพวกนี้น่าจะมีสอนโดยทั่วไปในระดับมหาวิทยาลัยอยู่แล้ว นั่นหมายความว่านักศึกษาจบใหม่ก็สามารถเริ่มงานตำแหน่งนี้ได้เช่นกันครับถ้ามีพื้นฐานของ Tech Stack ด้านบนอยู่บ้าง ก็จะช่วยลดเวลาในการเรียนรู้งานช่วงแรกได้ครับ
Site Reliability Engineer มี Career Path ยังไงบ้าง
ในส่วนของ Career Path ที่ THiNKNET เราแบ่งกันชัดเจนระหว่าง Technical กับ Management ครับ ซึ่งสามารถเติบโตไปได้ทั้ง 2 สายตาม Performance จริง ๆ
- ฝั่ง Technical ก็จะมี Senior, Technical Specialist เป็นต้น
- ฝั่ง Management ก็จะมี Supervisor หรือ Manager เป็นต้น
DevOps vs SRE ต่างกันยังไง
อ่านถึงตรงนี้อาจมีคนสงสัยว่า เอ้ะ ทำไม Stack เหมือนกับ DevOps ในบางที่เลย ก็ต้องตอบว่าสองตำแหน่งนี้ มีความเป็นแฝดคนละฝากันอยู่ครับในมุมองของผู้เขียน
- DevOps จะโฟกัสไปกับ Delivery ทำอย่างไรให้ Software ไปถึงมือ User เร็วที่สุด
- SRE จะโฟกัสไปกับ Reliability ทำอย่างไรให้ Software ไปถึงมือ User มีเสถียรภาพที่สุด
จึงไม่แปลกเลยที่ 2 ตำแหน่งนี้จะมีความคล้ายกัน ขึ้นอยู่กับแต่ละที่จะให้นิยามเหมือนหรือต่างกันอย่างไรมากกว่า
ทำงานจากที่ไหนก็ได้ ทำได้จริงที่ THiNKNET
ที่ THiNKNET ของเราทำงานจากที่ไหนก็ได้ครับ ตาม Concept ของ Work from Anywhere ไม่ว่าจะเป็นที่บ้าน บนภูเขา กลางทะเล ขอแค่มี Internet ให้ใช้งานก็สามารถที่จะทำงานได้ทุกที่เลยครับ แอบสปอยล์ว่ามีบางคนทำจากต่างประเทศด้วยนะ
การที่ได้ #WorkfromAnywhere ช่วยยกระดับคุณภาพชีวิตได้เยอะ ไม่ต้องตื่นแต่เช้า ไม่ต้องรีบอาบน้ำแต่งตัว เหนื่อยเพลียกับการเดินทาง มีค่าใช้จ่ายที่เพิ่มตามมา ประหยัดทั้งเงินทั้งเวลาไปพร้อม ๆ กันเลย ส่วนใครที่กลัวเหงาก็ไม่ต้องกังวลไปครับ ระหว่างที่ทำงานเราก็มีการพูดคุยสื่อสารกันเป็นปกติอยู่แล้ว นอกจากนี้ก็ยังมีนัดกันเข้าออฟฟิศ พบปะสังสรรค์กันอยู่เป็นประจำ ซึ่งการทำงานของเรายังใช้ระบบ Flexible Hour ด้วยนะ นั่นคือขอแค่ทำงานให้ครบ 40 ชั่วโมง/สัปดาห์ จันทร์-อาทิตย์ ทั้งสัปดาห์ สามารถบริหารเวลาเองได้เลย บางวันอยากเลิกงานเร็ว บางวันอยากเข้างานช้า เราสามารถบริหารจัดการเวลาของเราได้เองเลยด้วย
มาเป็นร่วมเป็นส่วนหนึ่งของทีม SRE กันเถอะ!
เชื่อว่าผู้อ่านทุกคนจะเข้าใจได้มากขึ้นว่าตำแหน่ง SRE ทำงานเกี่ยวกับอะไรบ้าง หากรู้สึกสนใจที่จะมาเป็นส่วนหนึ่งของทีม SRE ที่ THiNKNET แล้ว ก็กดสมัคร ที่นี่ ได้เลยครับ หวังว่าจะได้ร่วมงานกันที่ THiNKNET ครับ
ทำความรู้จักตำแหน่งอื่น ๆ ใน THiNKNET ทั้งหมดได้ ที่นี่