登入/註冊

登入

「網站可靠性工程師 Site Reliability Engineer(SRE)/DevOps Engineer (AWS, Kubernetes)」的相似工作

Name: Site Reliability Engineer (DevOps) | 站點可靠性工程師
Start: 2025/5/23
Location: 台北市南港區

TVBS_聯利媒體股份有限公司

共501筆

遠東SOGO百貨-00總公司-資訊管理工程師

遠東SOGO_太平洋崇光百貨股份有限公司百貨相關業

台北市大安區經歷不拘專科以上

《加入我們，打造數位世界的守護者與創造者！》在這個科技快速發展的時代，資訊管理工程師是企業數位運作的核心。你不僅需要維護設備，還需確保每台主機和網路都順暢運行，讓每位使用者高效工作，企業的數位世界順利無縫。【工作內容】 1. 機房維運在這裡，你是數位世界的守護者！負責檢查與管理主機、設備和環境，確保一切順暢運行，讓資料中心如時鐘般精準無誤。 2. 使用者電腦處理當電腦出問題或系統卡住時，你是救援隊的核心！幫助使用者解決難題，確保工作不受阻，讓每個挑戰都成為你的成就感！ 3. 活動設備架設當公司有活動或會議，你是現場設備的搭建大師！音響、視訊系統、投影設備，一切無誤，讓活動順利又專業！ 4. 網路管理負責管理交換器(Cisco)、路由器(Cisco)和防火牆(FortiGate)，確保數據流暢且安全。 5. 伺服器系統管理對Windows Server、Linux系統管理及維護略懂尤佳。 6. 程式語言支持對程式語言略懂尤佳(PHP、JaveScript、Linux Shell、Python)。【成長與挑戰】 1. 專業成長這份工作讓你在資訊技術領域獲得多方位經驗，從硬體設置到網路配置，再到程式開發，讓你成為全能的資訊管理高手。 2. 挑戰與滿足感每天都會面對現場的各種挑戰，無論是解決系統故障還是設計新解決方案，每次成功都能帶來成就感。 3. 穩定與未來隨著科技不斷進步，資訊管理需求只會增加。這份工作不僅穩定，還將帶來更多的職業發展機會。『如果你熱愛科技，擅長解決問題，並希望在數位化浪潮中發揮關鍵影響力，那麼這個職位就是你的舞台！加入我們，與我們一同確保每一個系統、每一條網路都能穩定運行，為企業注入無限動力！』

月薪35,600元以上員工1500人

應徵

11~30 人應徵

05/23

Jr. Site Reliability Engineer 網站可靠性工程師

17LIVE_藝啟股份有限公司網際網路相關業

台北市中山區2年以上大學以上

17 LIVE 歡迎對以下工作內容有興趣的網站可靠性工程師加入我們的大家庭！您將負責：－負責 17LIVE 基礎架構和產品的整體性能和可靠性。－自動化：SRE 看不下去沒有自動化和工具的事情。－系統架構：知道系統運作生命週期(ex: 啟動到可以對外提供服務到停止)。－部署和變更管理：知道服務發布流程(例如: GitFlow、GitHubFlow、GitLabFlow)以及如何進行版本控制，理解 GitOps。－監控服務：了解如何收集log、metrics以及建立dashboard監控服務。－提高可用性：知道如何部署HA架構以及DR架構。－系統意外事件處理(改善 On-Call 的體驗，工具和程序），能夠初步判斷意外事件可能因素，協助進行事後分析。－了解 IaC 並至少會使用一種 IaC Tool，例如 Terraform。如果您具備以下工作技能及工作經驗，請不要猶豫立即手刀提出申請：－了解 Linux 基本運作原理和樂意更深入了解 Linux 內部結構。－良好的程式語言技能，至少在下列之一：Go、C、C ++、Python、Java 和學習其他語言的能力。－基礎的 Shell Script 技能。－具有 Kubernetes、 CI/CD 、Monitoring 維運經驗。－具有 IDC、AWS、GCP 或 Azure 的經驗。加分條件：－具備 Kubernetes 或是 cloud 相關證照－具備 container 相關知識，例如 docker、containerd、podman。－具備其中一種的知識：MySQL、MongoDB、ELK、Datadog、Prometheus 或類似技術。－了解 Caching 和 Queue Redis，memcache，RabbitMQ，Apache Kafka…）。－對開源軟體有貢獻。 We are currently hiring for Site Reliability Engineer professionals that will take part in: Responsible for the overall performance and reliability of 17LIVE’s infrastructure and products. SREs design and implement the tools that automate building reliable and performant systems. - Ensuring the overall performance and reliability of 17LIVE's infrastructure and products. - Automation: SREs can’t stand tasks that aren’t automated or tools that aren't in place. - System Architecture: Understanding the lifecycle of a system (e.g., from startup to service provision to shutdown). - Deployment and Change Management: Knowing the service release process (e.g., GitFlow, GitHubFlow, GitLabFlow) and how to manage version control, understanding GitOps. - Monitoring Services: Understanding how to collect logs, metrics, and create dashboards for monitoring services. - Enhancing Availability: Knowing how to deploy High Availability (HA) and Disaster Recovery (DR) architectures. - Incident Management: Handling system incidents (improving the On-Call experience with tools and procedures), being able to preliminarily identify possible causes of incidents, and assisting with post-incident analysis. - Understanding Infrastructure as Code (IaC) and being proficient with at least one IaC tool, such as Terraform. Good to Have： - Understanding the basic principles of Linux and a willingness to delve deeper into Linux's internal structure. - Strong programming skills in at least one of the following languages: Go, C, C++, Python, Java, and the ability to learn other languages. - Basic shell scripting skills. - Experience in maintaining Kubernetes, CI/CD, and Monitoring systems. - Experience with IDC, AWS, GCP, or Azure. You will be highly considered if you have the following experience: - Possessing Kubernetes or cloud-related certifications. - Knowledge of container technologies such as Docker, containerd, or podman. - Knowledge of one of the following: MySQL, MongoDB, ELK, Datadog, Prometheus, or similar technologies. - Understanding of caching and queue systems like Redis, Memcached, RabbitMQ, Apache Kafka, etc. - Contributions to open-source software.

待遇面議員工800人

應徵

6~10 人應徵

04/23

Site Reliability Engineer (DevOps) | 站點可靠性工程師

聯齊科技股份有限公司光電產業

台北市南港區3年以上大學以上

Driving with us to the Next! "Integration of various energy sources, improvement in energy efficiency, and creation of a powerful platform that benefits everyone" 【Job Description】 We are in search of SRE engineer who can seamlessly integrate development artifact with cloud resources. The candidate needs to have hands-on experience on public cloud usage and work closely on container world. We are looking for highly self-motivated engineer to join to build operational environments to support from customer service to development. Daily task might include explore to the latest technology to be adopted to resolve business problems. 【Core Responsibilities】 • Work closely with engineer teams to identify and implement optimal cloud-based solutions for the company. • Build and maintain the agile / responsive container native CI/CD pipelines (Jenkins / ArgoCD), and support multiple development teams to deliver high-quality builds with measurable performance • Build, maintain, improve, scale and secure cloud infrastructures and resources by using IaC tools (Terraform / Pulumi) with cost consideration • Build automation tools to improve system's observability, availability and reliability via Python and Serverless solutions (AWS Lambda, Kubernetes Jobs) • Design, manage and monitor Kubernetes clusters for multiple production workloads • Participate in an on-call rotation to mitigate disruption for any production systems and conduct root cause analysis reports • Plan and test disaster recovery scenarios and business continuity plans for a highly available micro-services architecture • Develop and implement security policies in compliance with ISO 27001/27017 standards, including access control, encryption and logging • Build central dashboard and alert mechanisms to identify potential resource problems • Handle production issues with intelligent means 【Essential Qualification】 • Bachelor degree in computer related program • 3 year experience in AWS cloud management • 3 year experience in Kubernetes management • 3 year experience in CI/CD area (Jenkins) • 3 year experience in network or database (PostgreSQL, Cassandra, Redis) • 2 year experience in observability mechanism (Prometheus, Grafana, InfluxDB, OpenSearch, ELK) • 3 year experience in Linux • Performance tuning & error handling & root cause analysis • Need to on-call 【Desirable Abilities】 • AWS related certification • CKA, CKAD, CKS

待遇面議員工120人

應徵

0~5 人應徵

05/22

可靠性工程師 Site Reliability Engineer (SRE / DevOps)

SoundOn_聲浪媒體科技股份有限公司多媒體相關業

台北市松山區4年以上大學以上

【工作內容】 ▶︎ 使用基礎設施即代碼（IaC）工具（如 Ansible、Kubernetes）和 CI/CD 流程工具開發應用程式部署管道 ▶︎ 通過自動化等機制實現系統的可持續擴展，並推動改善系統可靠性和效率的變革 ▶︎ 維護和優化容器化平台（Kubernetes），確保服務的穩定性和效能 ▶︎ 熟悉資料庫, 如 MySQL ▶︎ 具備問題解決和故障排除能力，能夠快速識別並解決複雜問題 ▶︎ 對持續改善可觀測性實務和推動創新充滿熱忱【必備條件】 ▶︎ 理解大量分佈式系統，包括多層系統結構，應用程式安全性，Monitoring 和 Storage ▶︎ 具備 kubernetes、 CI/CD 維運經驗 ▶︎ 具有 AWS 或 GCP 的經驗 (EKS 加分) ▶︎ MySQL

待遇面議員工50人

應徵

6~10 人應徵

05/19

網站/系統可靠性工程師 SRE (System Reliability Engineer)(台北)

名豐電子股份有限公司電腦軟體服務業

台北市大安區3年以上專科以上

1. 建置與維護研發單位需要的開發環境 2. 建置與維護日誌、監控、部署等維運工具 3. 建置與維護營業需要的雲端環境 4. 執行系統異常問題追蹤與排除作業 5. 定期檢視並記錄監控數據，持續改善服務架構 *1-2年以上遊戲線上產品維運者佳

待遇面議員工100人

應徵

6~10 人應徵

05/06

DevSecOps工程師

宏燁資訊股份有限公司電腦系統整合服務業

台北市中正區1年以上專科

應用各種IT知識在DevSecOps專案中，可自我發想和開放心態應用各式系統，研習自動化並持續提昇效率，須正面應對處理和冷靜判斷系統的未知問題。系統的評估、建置、自動化和程式開發，建構符合SRE的Metrics：SLA、SLI、SLO系統環境實作Openshift Container Platform(OCP)、Kubernetes(K8s)、VM、AP、Linux和Windows Server、資料庫和資安軟體的Pipeline。閱讀各式文件，操作說明書的撰寫，協助平台之教育訓練。依公司專案需求，學習指定的專業套裝軟體、研讀原廠文件並至客戶環境安裝

待遇面議員工170人

應徵

0~5 人應徵

05/20

【寵物公園】-Site Reliability Engineer 網站可靠性工程師 SRE

萬達寵物事業股份有限公司百貨相關業

台北市中山區5年以上專科以上

▍公司簡介寵物公園是台灣最知名的寵物連鎖體系集團之一，我們正積極拓展，旨在成為全台灣最具影響力的寵物生活產業集團。在快速擴張的店鋪網絡中，我們正在尋找志同道合的夥伴，與我們攜手挑戰，改變寵物產業的格局！ ▍企業使命讓我們用『愛』共同打造更美好的『毛宇宙』。寵物公園目前正在尋找熱愛毛寶貝，並致力於傳遞溫暖、守護毛寶貝幸福的您，一同打造屬於我們與毛寶貝共同的幸福人生。 ▍招聘職位 Site Reliability Engineer 網站可靠性工程師【我們團隊的特色是這樣的】 - 扁平化的溝通文化我們目的都是把事情做好，如果有話想說，就勇敢的說出來！團隊有著新創的靈魂，樂於在新專案上嘗試使用各種不同的新技術 - 技術與難題的交流你的問題可能就是我的問題，大家集思廣益就沒有問題！技術的分享不遺餘力，我們的目標是每個夥伴都可以獨立掌控整個專案！ - 琢磨於架構與風格「好的架構讓你準時回家，好的風格讓你身體健康」為了不讓未來的夥伴天天想找時光機，設計好用的函數庫也是我們不斷努力的方向 - 友善的工程師團隊沒有配備刀械的 PM，沒有開著 IDE 發呆同事，沒有看影片還裝忙的老闆，更沒有上演八點檔的團隊文化。我們認真執行任務，保持溝通暢通，追求準時下班，建立美好生活。 - 依據客戶需求開發客戶、使用者、需求方，都是我們的人！所以你有無限空間去完成你自己的想像，只要使用者用得開心，我們都開心 ▍職務需求 A.主要工作內容： 1.設計並維護應用程式與基礎設施的監控機制，運用工具（如 Amazon CloudWatch、Prometheus、Grafana 等）收集並分析 Metrics、Logs、Tracing 資訊。 2.依據監控指標持續優化雲端資源配置及系統效能；建立或優化警示機制（Alerting），確保在事件發生前後能即時獲得通知並快速處理。 3.與團隊及業務單位共同訂定並維護 SLA 指標（如可用率、回應時間等），並根據服務水平指標（SLO/SLA）的達成情況，提出系統優化與改善方案。 4.分析系統負載趨勢與用量資料，預測未來資源需求並制定擴充計畫。 5.透過 Auto Scaling、架構調整或資源升級等方式，確保系統在高併發或突發流量下的服務品質。 6.升級資訊架構：協助公司進行 IT 架構的升級與擴展，提供技術建議，確保資訊架構的前瞻性與穩定性。 B.必備技能： 1. AWS 雲端經驗：熟悉 AWS 核心服務（DMS、ECR、ECS、S3、Athena、Glue、VPC等）的配置與操作；具備 Infrastructure as Code（IaC）知識，能運用 Terraform、CloudFormation 等工具進行自動化部署。 2.能夠針對應用程式、系統與網路問題進行監控配置與事件分析，至少一種常見的監控/可觀測性技術（Prometheus/Grafana、Elasticsearch/Kibana、CloudWatch/CloudTrail 等） 3.具備基礎 CI/CD 知識，可撰寫自動化工具。 4.具備良好溝通與協調能力，能在跨部門（產品、研發、測試）間快速協作；獨立分析與解決問題的能力，遇到故障時能迅速鎖定根因並提出解決方案。加分技能： 1. 對高可用架構（HA）設計有深入了解，如多區域部署、跨區故障轉移等。 2. AWS 進階技能：有角色與權限管理經驗，能規劃與落實安全性存取控制；熟悉雲端節費策略；。 3. AWS 安全性：熟悉AWS Security Best Practices，能配置安全與合規機制。萬達寵物資訊部部落格 https://medium.com/reactfunctioncomponentnote ▍加入我們感謝您對我們的關注，我們期待與您攜手共創美好未來！ ▍【福利】 ★到職即享10天特休(採特休預給制)。 ★高績效獎金及年終獎金平均1-1.5個月起(優於同業)，績優人員可達4個月。 ★端午、中秋獎金及生日禮金。 ★好幾百萬等級的尾牙及聚餐活動獲補助(大獎中獎率達20%、全員通通有獎、通路中最優) 。 ★每月都有教育訓練的課可以上，外面很貴的課，公司開給您，並提供教育訓練補助。 ★免費提供團體保險、為您多一分呵護與保障。 ★不定期的訂餐犒賞、飲料及下午茶獎勵。

待遇面議員工850人

應徵

6~10 人應徵

05/21

Sr. Devops/ DevOps (工作地點：台北/台中)

艾克森科技有限公司電腦系統整合服務業

台北市信義區3年以上專科

[Requirement] 1. 熟悉CI/CD自動化運維之解決方案(Jenkins, Gitlab CI, Ansible, Terraform ) 2. 熟悉基於雲端服務(Aliyun/AWS/GCP)之雲端解決方案 3. 熟悉任一版本之Linux(Centos, Ubuntu, SUSE...etc)之系統管理、調校管理 4. 熟悉容器相關的平台操作（docker-compose, Kubernetes) 5. 具備基礎 Script 開發維護能力 (ex: Shell Script、Python、Go) [Nice to Have]： 1. 具有大型網站服務之高可用性架構規劃、建置、維護經驗者佳。 2. 具有DevOps CI/CD實際導入經驗者佳。 3. 具備良好的溝通表達能力與正常人的抗壓性。 (工作地點：台北或台中皆可)

年薪1,000,000元以上員工180人

應徵

0~5 人應徵

05/19

DevOps Engineer

旭捷資訊有限公司電腦軟體服務業

台北市中山區1年以上大學

1.DevOps導入與自動化維運工具建置。 2.自動化部署流程設計與自動化部署框架的設計、開發、維護。 3.監控、維護DevOps所需各項基礎服務。 4.配合開發人員和測試人員進行環境搭建、參數配置、業務調試及系統監控。 5.配合團隊分析問題處理突發狀況，降低風險並優化流程。 6.k8s基礎架設、管理及監控擅長工具 linux terraform jenkins aws k8s

待遇面議員工40人

應徵

0~5 人應徵

05/20

Kubernetes工程師

寬橋有限公司網際網路相關業

台北市大安區經歷不拘大學以上

▍公司簡介及理念寬橋 BROBRIDGE 成立於2016年，是一家雲原生軟體產品開發暨微服務技術顧問公司，並已取得多數專業認證。台灣少數通過 Kubernetes 官方組織 CNCF 認可之 KCSP (Kubernetes Certified Service Partner) 國際認證。團隊成員曾貢獻國際大型 Open Source 專案，並參與企業級大型專案，全球使用者超過 2500 萬。強調在【微服務 | MicroService 】與【容器平台 | Kubernetes 】相關產品開發，以及資料中心及雲端基礎架構設計，尤以微服務為核心技術能力，建構貼近客戶需要的商品及服務，尤其是在發展微服務時期最需要的【讀寫分離 | CQRS 】、【資料庫私有化 | Database Per Service 】，透過數位轉型提升業務迭代速度，創造整體商業價值與絕對優勢，並提供即時支援服務，協助企業面對變化多端的市場挑戰。寬橋團隊在各種技術堆棧已經提供了大多數新一代的專業從業人員足夠的養份，傳承除了經驗更重要的是高度與廣度的開拓，團隊強調完整的師徒協作機制，重新定義了新一代軟體職人的開發模式，不論是各個職位均會以此方式進行。 ▍工作內容 ➊ 與 Mentors 學習 Kubernetes 與微服務前沿技術，並執行公司交辦之技術交付工作。 ➋ 負責協調並處理主要客戶問題。 ➌ 技術養成後規劃設計各式大型架構。 ▍必要條件 ➊ 對 Kubernetes 基礎架構建置維運與 SRE 有興趣。 ➋ 個性細心、積極、擅溝通，能獨立作業。 ➌ 有責任心、抗壓性高，有團隊合作觀念。 ▍經驗加分條件 ➊ 有 gitlab 與 gitlab-ci 的設置管理經驗。 ➋ 熟悉 kubernetes 相關的監控工具。 ➌ 熟悉 Ansible、Terraform 等自動化工具。 ➍ 熟悉網路架構與相關檢測指令或工具。 ➎ 熟悉 Linux 作業系統，或虛擬化平台 KVM 或 vSphere。 ▍資格加分條件 ➊ 具備 CKA / CKAD / CKS 證照。 ➋ 具備 Google / AWS / Azure 相關證照。

待遇面議

應徵

6~10 人應徵

05/20

【內湖】DevOps Engineer 雲端工程師

鑫鼎鑽科技有限公司電腦軟體服務業

台北市內湖區2年以上學歷不拘

工作職責： 1.雲端架構設計與實施：根據業務需求，設計、部署和維護基於 AWS 的雲端基礎設施，確保系統的可擴展性、高可用性和安全性。 2.雲端服務管理：管理和優化 AWS 雲服務，如 ECS、EC2、S3、RDS、VPC 等，提升資源利用率和成本效益。 3.自動化部署與 CI/CD：建立和維護自動化部署流程，使用工具如 Jenkins、GitLab CI、Ansible、Terraform 等，實現持續整合與持續部署。 4.系統監控與故障排除：使用監控工具（如 Prometheus、Grafana）監控系統性能，及時發現並解決潛在問題，保障系統穩定運行。 5.安全合規與最佳實踐：確保雲端環境符合安全標準和合規要求，實施最佳安全實踐，如身份驗證、權限管理和資料加密。 6.技術文檔與知識分享：編寫和維護技術文檔，與團隊分享雲端技術和工具的最佳實踐。 7.團隊協作與支持：與開發、運維和其他相關團隊緊密合作，提供技術支持和指導。任職要求：工作經驗： 3 年以上雲端相關工作經驗。技術技能： 1.雲服務經驗：熟悉 AWS 雲服務的各項產品和功能，能夠獨立完成雲端架構的設計和實施。 2.自動化工具：熟練使用自動化部署和基礎設施即代碼（IaC）工具，如 Ansible、Terraform、CloudFormation 等。 3.容器技術：熟悉 Docker 和 Kubernetes，能夠部署和管理容器化應用。 4.CI/CD 流程：具備建立和維護 CI/CD 流程的經驗，熟悉 Jenkins、GitLab CI 等工具。 5.程式語言：熟練掌握至少一種編程或腳本語言（如 Python、Go、Shell），能夠編寫自動化腳本和工具。其他技能： 1.系統監控：熟悉監控和日志分析工具，如 Prometheus、Grafana、ELK Stack。 2.資料庫知識：了解關聯式資料庫（如 MySQL、PostgreSQL）和 NoSQL 資料庫的管理與優化。 3.安全意識：具備雲端安全的知識，能夠實施安全最佳實踐。 4.問題解決能力：優秀的分析和解決問題能力，能夠在高壓環境下快速定位並解決問題。 5.溝通協作：良好的團隊合作精神和溝通能力，能夠與跨部門團隊有效協作。語言能力：英文讀寫能力：能夠熟練閱讀和理解英文技術文檔。

待遇面議員工115人

應徵

0~5 人應徵

05/21

系統可靠度工程師(SRE)

淮南寰宇股份有限公司其他電信及通訊相關業

新北市三重區3年以上專科

1. Kubernetes 架構設計與維運：規劃、部署、維護高可用的 Kubernetes 叢集，確保系統穩定運行。 2. CI/CD 部署：建置與優化應用部署流程，確保版本更新順暢且可Rollback。 3. 監控與告警機制：運用 Prometheus、Grafana、Loki 建立監控與日誌管理，確保異常即時發現與處理。 4. 效能與資源最佳化：調校 Kubernetes 資源配置，確保系統運行效率。 5. 故障排除與高可用性：分析與排除系統異常。 6. 與開發團隊協作：與開發團隊合作，提供 SRE 觀點，優化應用程式在 Kubernetes 上的運行方式。

待遇面議員工130人

應徵

0~5 人應徵

05/20

系統可靠度工程師 (SRE)

天譽軟體有限公司電腦系統整合服務業

台北市內湖區5年以上大學以上

我們正在尋找一位有經驗的網站可靠性工程師（SRE）加入我們的團隊。此職位將負責監控和維護我們的系統和服務，以確保它們的高可用性和性能。理想的候選人應該具備良好的技術背景、問題解決能力和與外部廠商溝通的能力。 1. 日常監控查看、通報：監控系統和服務的運行情況，及時通報異常情況並進行初步處理。使用監控工具（如Prometheus、Grafana等）進行日常監控。 2. 新增、微調監控項目：根據需求新增或調整監控項目，確保監控覆蓋所有關鍵服務。持續優化監控指標和告警策略。 3. 域名驗證、域名設定：負責域名的驗證和設定，確保域名配置正確無誤。維護域名相關的DNS記錄。 4. 事件記錄與追蹤：記錄所有系統事件和事故，並追蹤處理過程。實施問題根因分析（RCA），並撰寫事件報告。 5. 確認告警項目與處理：定期審查告警項目，確認其有效性。迅速處理告警，並根據情況進行升級。 6. 查看、確認log，確認問題原因：監控並分析系統日誌，識別並解決潛在問題。使用工具（如 ELK 堆棧）進行日誌管理和分析。 7. 上下架DNS域名與設定CDN：負責DNS域名的上下架和配置。設定和優化CDN服務，以提升網站性能。 8. 確認各服務項目運作情況與回報：定期檢查各服務的運作情況，確保系統穩定。向相關部門回報服務狀況和改進建議。 9. 溝通外部廠商服務設定：與外部廠商協調和溝通，確保服務設置和配置符合要求。參與外部服務的測試和驗收。

待遇面議員工30人

應徵

0~5 人應徵

05/06

【Platform Team】網站可靠性工程師 Site Reliability Engineer

愛卡拉互動媒體股份有限公司電腦軟體服務業

台北市中山區3年以上大學

We are looking for a Site Reliability Engineer (SRE) to make sure our cloud-based commerce platform is up and running and healthy. As a SRE for iKala Commerce, you will be responsible for everything from our cloud infrastructure and operating systems to developing tools for code deployment and service monitoring. You will also review our code and system design and partner with developers to build our applications. The SRE role is an integral member of our product development team. You will be a part of the team that makes crucial decisions about how to manage and scale complex, high-performance distributed systems. You will also provide your own perspective on our backend systems and constantly develop innovative ways to improve the way we manage the underlying infrastructure. Our ideal candidate should be able to develop applications on his/her own, but more eager to accelerate the whole team by building systems to improve performance and operational efficiency. Ultimately, you should be involved in all stages of software development to define and improve our SLOs, SLAs & SLIs. Our current tech stack include: GCP, Terraform, Kubernetes, Helm, ArgoCD, Gitlab-CI/CD, Grafana LGTM, 【Key Responsibilities】　 1. Designing & implementing infrastructure for collecting metrics, crunching data and improving service monitoring to detect problems before they're visible to our customers. 2. Building systems to automate our server lifecycle, from configuration management, CI/CD to server bootstrap and decommission. 3. Troubleshooting, performing root cause analysis, and resolving production issues from the application and network layers all the way down to the system level. 4. Participating in solution design and advising other developers when building new features so that they're scalable, maintainable, and performing well. 5. Improving the observability of our applications through monitoring, alerting, logging, tracing and profiling, and building such observability features into a common platform. 6. Practicing sustainable incident response and blameless postmortems. 7. Proactively identifying and reducing issues through design, testing, and implementation of software-based solutions. More Info>>>https://www.ikala.ai

待遇面議員工200人

應徵

6~10 人應徵

05/16

【全球智慧製造】網站可靠性工程師 DevOps Engineer/SRE_新店

GARMIN_台灣國際航電股份有限公司電信相關業

新北市新店區經歷不拘碩士

【全球智慧製造】你知道Garmin的智慧工廠嗎? 你知道火星上出現過Garmin的產品嗎? 你知道飛行員總是配戴Garmin的手錶上天空嗎? 全球智慧製造服務計畫(GSMS)透過AI、機構、電控、資料科學、IoT、大數據等技術，將智慧製造系統，即時控制與調整全球生產系統，且在地化支援亞洲、美洲、歐洲多個國家如果你想體驗不同的文化，綻放自己的光芒！現在就投遞履歷，讓我們見識你的獨特潛力！【部門說明】 1. 透過資訊化系統結合 AI、數據、影像來輔助產線流程及蒐集產線資訊 2. 透過自動化程式碼測試、程式碼品質檢測、自動化程式佈署、監控、警報來把關系統品質，並提升系統穩定度【工作內容/角色】 1. 建置與維護 On-Premise Kubernetes (K8s) 2. 建置與維護 Linux / Windows Server 及相關服務 3. 協助開發人員整合 ASP.NET Core C# 至 CI/CD 流程 4. 建置監控機制 5. 提升系統品質

待遇面議員工9000人

應徵

11~30 人應徵

05/21

系統可靠度工程師 SRE (System Reliability Engineer)

飛騰軟體科技有限公司電腦軟體服務業

新北市新莊區3年以上大學以上

我們正在尋找一位經驗豐富的系統可靠度工程師（SRE）加入我們的技術團隊。此職位將負責設計與維護高可用、高效能的基礎架構與應用服務，確保系統穩定運行、快速擴展，並能在發生問題時迅速響應與修復。理想的候選人需具備強大的系統管理經驗、自動化能力、故障分析技巧，並能與內外部團隊進行有效協作。主要職責：系統設計與維運 • 建置並維護可擴展、高可用的基礎設施與服務架構。 • 管理 Linux/Unix 與 Windows 系統的日常運作與安全。 • 管理 DNS、SSL 憑證與域名設定，確保服務正常可用。監控與自動化 • 架設並維護監控與告警系統（Prometheus、Grafana、ELK Stack）。 • 實作自動化部署與基礎設施配置（如 Ansible、Terraform、Puppet、Chef）。 • 撰寫腳本（Python、Go、Shell 等）進行營運流程自動化。故障處理與最佳化 • 即時監控系統健康狀況，並主動應對異常。 • 執行根因分析（RCA）與預防性修正，降低系統故障率。 • 優化應用性能與資源使用，支援高併發流量。 • 規劃資料備份與災難復原策略，保障營運連續性。協作與知識傳承 • 與開發、資安、產品等團隊協作，提升系統可維護性與觀察性。 • 撰寫系統架構文件與操作手冊，推動知識傳承與流程標準化。 • 對外協調雲服務商、維運廠商等技術支援。技術技能需求：系統與網路 • 熟悉 Linux/Unix 操作環境與網路協定（TCP/IP、DNS、TLS）。 • 能在 CLI 模式下熟練操作系統管理任務。 • 具網路與雲端安全防護知識，了解基本防火牆、存取控制原則。程式與自動化 • 熟悉程式語言（如 C#、NodeJS、Java、Go、Python）之一，具程式開發能力。 • 熟悉 Git 版本控制，具團隊協作與 Pull Request 工作流經驗。 • 熟練自動化部署工具（Ansible、Terraform、Puppet、Chef 等）。部署與平台操作 • 熟悉 Docker 容器技術與 Kubernetes 編排。 • 有實際操作 AWS、GCP 或 Azure 雲平台經驗。 • 熟悉 Jenkins、GitLab CI 等 CI/CD 工具。儲存與通訊架構 • 能部署與監控關聯式資料庫（MySQL、PostgreSQL、MSSQL、Oracle）。 • 熟悉 NoSQL（如 MongoDB、Redis）與訊息系統（如 Kafka、RabbitMQ）。 • 熟悉 gRPC 或其他 RPC 架構整合方式。

待遇面議

應徵

6~10 人應徵

05/20

AWS_(資深)雲端架構師

博弘雲端科技股份有限公司網際網路相關業

台北市中山區2年以上大學

【工作內容】 1.雲端服務架構規劃與建議：與客戶進行需求討論，或協助客戶盤點即有系統與架構，提供最佳架構或解決方案 2.專案簡報與文件製作：撰寫相關專案簡報與文件，並整理、條列相關工作項目，與客戶或內部確認需求與執行項目 3.專案服務建置與客戶支援：確認專案範籌符合客戶需求，完成雲端服務及相關系統建置，與協助客戶處理技術問題，排除故障 4.服務介紹與教育訓練：介紹相關服務功能與架構應用，提供客戶相關訓練 5.團隊協作與專案協助：與團隊成員一同執行並完成內、外部專案【需求條件】 1. 具備任一、二種公有雲服務建置或維運經驗(AWS/Azure/GCP) ，有證照佳 2. 熟悉以下相關專業領域：作業系統/網路/虛擬化架構/IaC 3. 態度積極，重視團隊合作，對新技術有研究熱忱 4. 具備客戶溝通經驗 5. 不排斥文件撰寫，樂於分享相關知識

待遇面議員工200人

應徵

0~5 人應徵

05/23

DevOps工程師

奇威雲端科技有限公司網際網路相關業

台北市大同區經歷不拘高中以上

1.設計、建立、優化並管理 CI/CD 流程，確保軟體快速穩定地從開發到部署 2.實施系統監控工具，持續監控系統健康狀況，主動解決效能瓶頸。 3.管理基礎設施的可用性和擴展性，優化資源配置。 4.設計並管理雲端基礎架構，確保高可用性與可靠性。 5.部署和管理容器化應用。 6.與開發、測試團隊合作，確保軟體從開發到正式運作的流暢運行 7.設計並落實 DevSecOps 策略，確保基礎設施與部署流程的安全性符合合規要求 8.其他主管交辦事項專業條件: 1.熟悉基礎架構即代碼(IaC)工具（如 Terraform、Ansible） 2.熟悉至少一種雲服務（AWS、Azure 或 GCP），具備部署與運維經驗。 3.具備解決問題的能力與快速學習新技術的能力。 4.優秀的跨部門溝通與協作能力。

月薪70,000~100,000元員工20人

應徵

6~10 人應徵

05/23

[CNS]雲原生容器平台DevOps/SRE工程師

動力安全資訊股份有限公司電腦系統整合服務業

台北市內湖區2年以上專科

我們正在尋找優秀的Kubernetes系統管理人員，協助我們的客戶構建容器化的雲端平台。主要的任務： 1. 負責Kubernetes/Openshift容器平台的管理，包含叢集建置、升級、故障排除等 2. 熟悉容器平台監控工具，如:Prometheus、Grafana、EFK stack等 3. 有自動化腳本撰寫經驗，使用工具如: Ansible、Python等 4. 熟悉Linux作業系統、網路 5. 對雲原生技術具有追根究柢的態度及能力

待遇面議員工300人

應徵

0~5 人應徵

05/22

DevOps Engineer_汐止_05113

緯創資通股份有限公司電腦及其週邊設備製造業

新北市汐止區1年以上大學

1.負責建置和維護Proxmox VE和Kubernetes環境。 2.將現有生產服務遷移至新建立的Kubernetes平台。 3.管理和優化Ceph存儲集群，確保數據安全和高效存取。 4.與團隊合作，確保平台的高可用性和性能。

待遇面議員工80000人

應徵

6~10 人應徵

05/19

SRE Engineer

綠創科技股份有限公司電腦系統整合服務業

台北市內湖區經歷不拘專科以上

IAdea focus on the total solution on latest IoT devices for the world's top enterprise customers. To help us build functional systems that fulfill customers need and improve user experience, we are looking for an experienced DevOps Engineer. You will be responsible for identifying production issues, implementing integrations with partners' services, and maintaining cloud infrastructure for daily operations. If you have a solid background in cloud and Kubernetes ecosystem and also are familiar with NodeJS development, we'd love to speak with you. ## Job description • Building and setting up new development tools and infrastructure. • Working on ways to automate and improve development and release processes. • Testing and examining code written by others and analyzing results. • Ensuring that systems are safe and secure against cybersecurity threats. • Identifying technical problems and developing software updates and fixes. • Working with software developers and software engineers to ensure that development follows established processes and works as intended. • Planning out projects and being involved in project management decisions. ## Responsibilities • Deploy updates and fixes. • Build tools to reduce occurrences of errors and improve customer experience. • Perform root cause analysis for production errors. • Investigate and resolve technical issues. • Develop scripts to automate deployment process • Design procedures for system troubleshooting and maintenance. ## Qualification Preferred: • Experience in Kubernetes ecosystem. • Experience in AWS/GCP/Azure cloud. • Understand the concept of infrastructure as code (IaC), and experience with tools such as Terraform/Pulumi and ArgoCD/Flux. • Experience in monitor tools like Promethues/Loki/Grafana. • BSc in Computer Science, Engineering or relevant field. Additional: • Knowledge of the JavaScript/Typescript ecosystem. • Experience in test case automation. • Experience in IOT infrastructure like MQTT broker, and data pipeline tools.

待遇面議

應徵

0~5 人應徵

共 501 筆，25 頁

前往頁面

104工作快找APP

「網站可靠性工程師 Site Reliability Engineer(SRE)/DevOps Engineer (AWS, Kubernetes)」的相似工作