AWS活用術|善用EC2靈活彈性的3個實例 - iThome

文章推薦指數: 80 %
投票人數:10人

EBS作為EC2的長期儲存服務,補足原本EC2只有暫時儲存的缺陷。

我們能夠用API、命令列或圖形界面,輕鬆地加一個儲存空間(EBS volume)到EC2虛擬機器上。

移至主內容 按讚加入iThome粉絲團 文/iThome | 2012-07-06發表 AWS的EMR服務是可用來執行大量運算的MapReduce服務。

使用AWS中的EC2(ElasticComputeCloud)服務時,我們的使用經驗可以和用傳統硬體沒什麼差別,只是多了API等自動化的工具。

我們的重點在於心態,EC2有許多靈活的作法,可以節省時間和人力成本。

所以如果只是把既有的系統搬上EC2,常常還是無法運用出很有彈性的作法,因為既有系統不是依照雲端運算的心態去設計的,自然很多地方無法配合,發揮這些特性。

以下介紹一些簡單常見的作法,也可以看出一些EC2與傳統硬體的特性差別。

我們可以從這裡開始,利用EC2的優勢到我們的系統上。

用EBS快速複製檔案 EBS作為EC2的長期儲存服務,補足原本EC2只有暫時儲存的缺陷。

我們能夠用API、命令列或圖形界面,輕鬆地加一個儲存空間(EBSvolume)到EC2虛擬機器上。

並且對EBS儲存空間作快照(snapshot),提供高耐久性的備份儲存。

快照可以再回復成EBS儲存空間,且掛載到EC2虛擬機器上。

所以,如果你的系統裡需要大量相同的檔案,那就可以利用EBS的快照及還原儲存空間的功能,快速地讓每一個EC2虛擬機器,都有這些檔案,提供之後的運算使用。

用EBS回復掛掉的EC2虛擬機器 如果是使用EBS-boot的虛擬機器,如果EC2虛擬機器掛掉的話,可以很快地回復。

我比較常使用的流程如下: Step1.有一個EBS-boot的AMI,假設ID叫ami-11111111。

從這個AMI開了一個虛擬機器,ID叫i-11111111。

這個虛擬機器在開機時,掛載(attach)了一個新的EBS儲存空間,作為虛擬機器的開機磁碟,假設這個EBS儲存空間ID叫vol-11111111。

Step2.有一天,很不幸地,i-11111111掛了,怎麼重開也回復不了。

這時候,vol-11111111上的資料還在,而且保留著i-11111111最後的狀態。

Step3.使用ami-11111111再開一個新的EC2虛擬機器,新的ID假設叫i-22222222。

這個新的虛擬機器也掛載了新的EBS儲存空間,作為開機磁碟,假設ID叫vol-22222222。

Step4.把vol-11111111從i-11111111卸載(detach),因為i-11111111已經掛了,所以這一步有可能會久一點。

Step5.把i-22222222暫停(stop),不是關機(terminate),然後把vol-22222222卸載(detach)。

Step6.神奇的地方來了,把vol-11111111掛載到i-22222222,然後把i-22222222啟動(start)。

i-22222222上面有之前i-11111111的最新資料,就像沒有事發生一樣。

最後,要記得把不會再用到的i-11111111和vol-2222222都關掉,免得多花錢。

最好的事是,這一切都坐在自己位子上就可以完成了,我們甚至可以做自動化工具。

但是有一些環境會不同了,最常見的就是由於i-22222222的IP已經改了,所以需要做一些環境設定。

這個問題可以用一些方法處理,例如EIP或內部DNS、host檔。

另外,如果EC2虛擬機器除了開機磁碟用EBS儲存空間外,還掛載了別的EBS儲存空間,也要記得再處理。

用EC2處理大量運算的需求 有很多人認為如果長期開EC2虛擬機器,就失去使用IaaS的意義,還不如買實體機器,價錢也比較划算。

所以在EC2剛興起的那幾年,其實最多、最有名的使用案例,還是短時間內,處理固定量資料的用法。

另外,因為許多企業通常已經有不少的機器,要一下子全部搬到EC2也是不太可能的。

所以AWS提供VPC,讓新的或者說是動態增減的機器,都在EC2上面生成,透過VPN達成同一內網的效果。

AWS對大資料(BigData)運算或高性能運算(HPC)有提供許多服務,例如EMR是提供Hadoop的服務,ClusterCompute及ClusterGPUCompute是提供高性能運算,DedicatedInstances提供實體靠近並與其它人區隔的環境。

最近這幾年大資料運算越來越紅,可以說是趁著雲端運算的風潮,成為下一個熱門的話題。

由於資料量爆炸性的成長,所以常利用雲端運算服務來儲存。

儲存之後,又可以利用雲端運算動態分配運算資源的長處,計算出使用者的的答案。

如果問題比較急或比較大,那就多分配一些資源。

反之,如果想省錢,也有省錢的用法。

在開放源始碼的大資料運算工具裡,最常用的就是Hadoop了。

依照Hadoop的規格所開發出來的工作(job),就可以利用Hadoop的平行運算、工作分配、容錯等優勢。

如果是使用在IaaS上,例如在EC2裡自己管理一個Hadoop的叢集,或者是使用EMR,就能發揮雲端運算的優點,也就是動態資源配置。

當然,我們也可以不用Hadoop,但是至少還是會使用一種分散式、可容錯的檔案系統,如HDFS來儲存資料。

將這些工作搬到EC2或EMR上是相對比較容易且可達成的,因為這些工作的獨立性比較高。

通常都能在不影響主系統的情況下,搬到EC2上,來善用動態資源的優點。

不同使用SpotInstances的策略 「SpotInstances」是很特殊的EC2計價方式,也就是使用類似競標的方式來租用運算資源。

這種前所末有的計價方式,讓我們有更多種靈活規劃要使用的運算資源與花費的平衡。

會有這種計價方式,可以說是資源運用的極致。

因為使用者租用EC2的總體使用量,一定會有尖峰和離峰的情況。

在尖峰時,EC2會調高SpotInstances的價格,而離峰時EC2希望你來租,當然就調低價格。

由於EC2的固定操作成本已經在那裡了,如果目前EC2的總體使用量偏低,EC2可以把價格調低,吸引使用者來開機器。

我們先鎖定我們要開EC2的地區、機器大小、作業系統等,確定好規格,這是因為SpotInstances的標價依這些規格而不同。

鎖定規格好之後,可以觀察過去一個星期、或三個月內的價格走勢。

然後,要注意你想開機周期的最高和最低價格,如果你出的價格比最低的還低,就不太可能會有機器開起來。

而相對的,如果你出的價格比最高的還高,這些機器大概就不會被關掉。

雖然過去的績效,不代表未來的表現。

不過總是要有一個參考,來定出我們使用SpotInstances的策略。

所以,當你出的價錢比目前的SpotInstances標價還低時,EC2會自動幫你開機,而套用的價錢是目前的標價,而不是你出的標價。

不過,當你出的價錢比目前的SpotInstances標價還低時,這些SpotInstances就會被EC2給關掉了。

因為這些SpotInstances的特性,所以要使用SpotInstances的工作就有一些限制。

例如,開起來的SpotInstances一定要可以自動加入叢集並且工作,工作的輸入、輸出和中間檔案,也要能存在不會因為SpotInstances被關掉而消失的地方,例如S3、SimpleDB、EBS等,或其它非SpotInstances的EC2虛擬機器上。

因為這些流程是和工作內容相關,所以通常需要為SpotInstances客製化一套系統。

不過通常少不了以下這些元件:流程管理、分散式儲存、狀態監控及示警等。

而這些元件通常是不會放在SpotInstances之內的,所以這部份的花費和開發及管理也要記得算進來。

另外,即使我們完成了自動化伸縮的SpotInstances叢集,也不能太頻繁的增減節點。

因為增減節點對系統是額外負擔,如果這些負擔太大,很容易對效能造成不好的影響。

就像我常說的,雲端運算是給了我們更多可能性,而不是單純的和原本硬體系統相比較規格與花費。

尤其是AWS,有這麼多的服務,每個服務有許多的細節,服務之間又能互相組合,製造了許多系統架構及管理上的伸縮性及方便性。

目前AWS仍然不斷推進服務,提供給我們系統更多新的組合。

而未來最大的限制,可能是我們的想像力。

  《作者簡介》 林允溥 《AWS雲端企業實戰聖經》一書的作者,也是資深軟體工程師,曾任職於美商Sosauce軟體公司,參與社群網站及3D遊戲網站的開發。

從2006年AmazonWebServices推出後,就開始運用AWS服務來建置網站,因而熟知AWS各種優勢、缺點、使用策略與問題解決方法。

相關報導請參考「Amazon雲端服務活用術」 熱門新聞 ApacheLog4j再釋出2.17版,修補DoS漏洞 2021-12-20 WebSocket成Log4j漏洞攻擊新管道,連不對外網路主機也曝險 2021-12-21 東元與旗下東捷資訊遭駭客網路攻擊,部分資訊系統受影響 2021-12-20 新的無檔案惡意程式DarkWatchman以Windows登錄檔作為藏身之處 2021-12-20 微軟呼籲用戶儘快修補11月公布的兩個WindowsAD漏洞 2021-12-21 CISA釋出掃瞄Log4j漏洞工具 2021-12-23 【資安日報】2021年12月20日,Log4Shell出現新的阻斷服務漏洞、勒索軟體Conti鎖定VMwarevCenter發動攻擊 2021-12-20 比利時國防部證實系統因Log4j漏洞遭駭 2021-12-21 Advertisement 2021iThome鐵人賽 專題報導 AWS2022新戰略 臺灣製造!世界第一物件偵測AI Nvidia2022新戰略 臺灣第一輛自駕貨車上路 Line2021AI生產力大改造 更多專題報導



請為這篇文章評分?