人在夢中難覺……夢醒……方知味……
今天才知道vistual studio 的神奇地方, 直接滑鼠按一按,dockerfile就自動產生了, 也不用寫,不過不是vs code的版本。
頭一次碰到這種坑, 我linux有待加強 (哭
YT亂看的時候,看到有一個影片,再講如何獲取免費的office, 這其實不是新聞,但有問題的通常都是再破解上面, 可能被人惡意亂塞間諜程式或木馬。 但現在驗證救直接從官方來了
新公司的第一個dockerfile就撞牆, 莫名的錯誤,裝了還是過不了, 寫這個程式的說也沒用過,他們都是用本機跑AI。 只好自己亂搞了…
禮拜一上班就聽同事再說,filebeat stage環境有問題, 我還在禮拜一症候群阿~~ 哎~SRE的宿命,先修吧
因為之前用的巴哈自動簽到,那個github被封了, 說違反服務條款,還好我主程式有下載下來過。 未來把他打包成image後在本機跑了吧, 不過要先解析github的workflow看是怎麼打包成image的
今天維護,後端同仁要cloudSQL的備份檔, 然後,因為他們都沒權限,只好丟去網路空間,給他們抓。 我就在想,沒道理阿,應該有個方法能夠開特定的檔案臨時給人用。
公司一臺電腦,我自己帶了一臺mac過去, 因為我已經linux用習慣了(X) 不得不說mac用習慣真的好順…
換公司後,DevOps還要兼網管, 然後,在辦公室還要連vpn才能連到dev的開發環境(? 我很懶,為什麼要這樣對我,科技始終來自於人類的惰性,開工吧。
最近弄之前的人自建的k8s, 才碰到一堆問題, 我的linux果然需要加強orz
接到同事說要裝rabbitmq, 說之前在dev有裝過,但在k8s上面沒看到, 用之前前任留下的yaml,裝不起來,只好從頭開始。
因為一直背不起來 OSI七層,上網查了下發現還真的有人發明了口訣 OSI由最上層往下 All People Seem To Need Domino’s Pizza (所有的人看來都需要達美樂比薩)
要算一下各服務所佔的比例, 大方向用VM的機器 cpu來算
一個一個點進去VM機器裡面算CPU的數量是可行,
但我好懶!!!太沒效率了,寫指令撈吧,然後把資料丟去excel做加總。
我一直對nginx不太熟, 目前也只到了會用,大部分的指令看得懂。 但湊在一起,還是要查一下。
這次的錯誤就發生在我以為的問題上
代理伺服器,以前最常用過的應該是Hinet的proxy, 在以前網路不快的時候,有時會掛prxoy,來讓瀏覽速度變快。 proxy的用途主要也是如此,將user的請求透過prxoy去跟網站取得資料,再回給user。
但proxy分成很多種…下面簡單說明
p.s 在交接的時候,我才發現原來http代理不是每個人都知道!?
補充ingest 的 processor
用filebeat 蒐集 nginx的資料,取得的Nginx資料沒再經過分解, 導致沒辦法運用在efk上面。
這邊說的運用,指的是直接在Dscover上面直接用fileter的方式查詢到需要的資料。
因為資料都是一個欄位[Message],所以必須分解後指定他們資料對應的欄位。
最近用istio偵測,常碰到某個服務狀態會掉到80%以下, 那時都有看到APM的程式報錯,但沒人反應,最近有次發生在上班時間, 馬上聯絡同事看他的服務有沒有正常, 最後一路追, 發現狀態碼是回 503 DC ,對這個關鍵字有印象,但常會忘記他的全名。
發現有一整批的資源沒有加過 label , GCE的硬碟、負載平衡的前端轉導規則… 有些條件不一樣,一個一個加會瘋掉。 工程師就是懶…寫sh吧
要把別人寫的yaml拆開,然後整併到自己的image, 才發現service的 base 怎麼沒寫selector , 但佈署時卻有mapping到。
在正式環境,直接上了APM監控, 然後各個圖表代表的意思…, 我查一下。
所以這篇就這樣生出來了。
之前同事是直接自己土炮用golang寫timer, 不過如果碰到執行時間過長,重複執行的話, 就要判斷一堆狀態,決定要不要做, 那就改用k8s的cronJob了吧。
本來想直接用表格闡述兩邊不同的地方, 但發現我不知道從何下手。 只好先用條列代替了, 這兩套我都沒用過,因為…我直接從GKE開始XD。
換了個新版本, 就發現 APM不能用, 後來查了一查,才知道ECK多了一個新東西, Elastic Agent。 目前還有些沒支援,但這應該是未來ECK會走的方向了。
一兩個月沒看,沒想到版本就衝到8.1了, 照以前的做法,發現一堆錯誤, precondition ‘apm integration installed’ failed: error querying Elasticsearch for integration index templates: unexpected HTTP status: 404 Not Found…
因為公司政策, 要把label全部統一,之前有些已經命名過一次的但名稱不對, 一個一個改又好麻煩, 來寫command吧
再上篇 [[drone on GKE 建立]],有談到k8s runner, 那時候都在default 的 namespace上面運作, 所以沒什麼問題, 但一到了正式環境,要切專門的namespace, 就陣亡拉)))))
在某一天,drone就跳出來了 『Your license limit is exceeded。』 當下真是嚇死我了,當天又是維護日, 一堆程式要上版,自動佈署掛掉就完了,要通通手動上。 還好,沒事,只是跳個通知在那邊,查了一些文件, 都沒說到期了會怎樣,就這樣過了兩個月, 也都沒事發生,本來想繼續撐下去的, 但有其他東西要用,就順便一起動了。
之前發生過的, prometheus會這樣、gitlab最近在弄新版的CI/CD也跑這個出來。 本來想要之後有空再解決,但最近被DDOS攻擊時, 發現監控的grafana會卡住,因為他的prometheus ram爆了~~
有些東西偶爾會用,但碰到時就忘了怎麼寫, 還要回去翻一下, 此篇包含
因為dockershim的問題, 這次要搬cluster的node了。 但我根本忘記有哪個yaml有寫到 nodeSelector了, 一個一個看又好懶…怎麼辦?
此時,我們要知道『科技,始終來自於人類的惰性』,
來寫程式吧。
因為drone 的 kubernetes Runner的關係, 導致我有一個ns要預設取消istio inject, 但某些特定的pod要注入就失敗了。
最近用kibana做查詢或任何的API取資料時,有機率會發生下列的錯誤
[parent] Data too large, data for [<http_request>] would be [1054296800/1005.4mb],which is larger than the limit of [1020054732/972.7mb] ........
雖然說很偶發,但最近有越來越嚴重的趨勢。
所以,鼻子摸一摸,來解決吧。
使用預設的filebeat.yaml設定, 導致現在elasticsearch的log爆炸了。 連開都開不起來。 所以這次要解決兩個問題,
經過一早上的研究,發現我想得跟我要解決的問題不一樣XDDD
所以本文會在探討ILM的設定