本文探討Linux中主要的幾種零拷貝技術以及零拷貝技術適用的場景。為了迅速建立起零拷貝的概念,我們拿一個常用的場景進行引入: 引文## 在寫一個服務端程序時(Web Server或者文件服務器),文件下載是一個基本功能。這時候服務端的任務是:將服務端主機磁盤中的文件不做修改地從已連接的socket發出去,我們通常用下面的代碼完成:
while((n = read(diskfd, buf, BUF_SIZE)) > 0)
write(sockfd, buf , n);
基本操作就是循環的從磁盤讀入文件內容到緩沖區,再將緩沖區的內容發送到socket。但是由于Linux的I/O操作默認是緩沖I/O。這里面主要使用的也就是read和write兩個系統調用,我們并不知道操作系統在其中做了什么。實際上在以上I/O操作中,發生了多次的數據拷貝。 當應用程序訪問某塊數據時,操作系統首先會檢查,是不是最近訪問過此文件,文件內容是否緩存在內核緩沖區,如果是,操作系統則直接根據read系統調用提供的buf地址,將內核緩沖區的內容拷貝到buf所指定的用戶空間緩沖區中去。如果不是,操作系統則首先將磁盤上的數據拷貝的內核緩沖區,這一步目前主要依靠DMA來傳輸,然后再把內核緩沖區上的內容拷貝到用戶緩沖區中。 接下來,write系統調用再把用戶緩沖區的內容拷貝到網絡堆棧相關的內核緩沖區中,最后socket再把內核緩沖區的內容發送到網卡上。 說了這么多,不如看圖清楚: 數據拷貝 從上圖中可以看出,共產生了四次數據拷貝,即使使用了DMA來處理了與硬件的通訊,CPU仍然需要處理兩次數據拷貝,與此同時,在用戶態與內核態也發生了多次上下文切換,無疑也加重了CPU負擔。 什么是零拷貝技術(zero-copy)?## 零拷貝主要的任務就是避免CPU將數據從一塊存儲拷貝到另外一塊存儲,主要就是利用各種零拷貝技術,避免讓CPU做大量的數據拷貝任務,減少不必要的拷貝,或者讓別的組件來做這一類簡單的數據傳輸任務,讓CPU解脫出來專注于別的任務。這樣就可以讓系統資源的利用更加有效。 我們繼續回到引文中的例子,我們如何減少數據拷貝的次數呢?一個很明顯的著力點就是減少數據在內核空間和用戶空間來回拷貝,這也引入了零拷貝的一個類型: 讓數據傳輸不需要經過user space 使用mmap##### 我們減少拷貝次數的一種方法是調用mmap()來代替read調用:
buf = mmap(diskfd, len);
write(sockfd, buf, len);
應用程序調用mmap(),磁盤上的數據會通過DMA被拷貝的內核緩沖區,接著操作系統會把這段內核緩沖區與應用程序共享,這樣就不需要把內核緩沖區的內容往用戶空間拷貝。應用程序再調用write(),操作系統直接將內核緩沖區的內容拷貝到socket緩沖區中,這一切都發生在內核態,最后,socket緩沖區再把數據發到網卡去。 mmap 使用mmap替代read很明顯減少了一次拷貝,當拷貝數據量很大時,無疑提升了效率。但是使用mmap是有代價的。當你使用mmap時,你可能會遇到一些隱藏的陷阱。例如,當你的程序map了一個文件,但是當這個文件被另一個進程截斷(truncate)時, write系統調用會因為訪問非法地址而被SIGBUS信號終止。SIGBUS信號默認會殺死你的進程并產生一個coredump,如果你的服務器這樣被中止了,那會產生一筆損失。 通常我們使用以下解決方案避免這種問題: 為SIGBUS信號建立信號處理程序 使用文件租借鎖
if(fcntl(diskfd, F_SETSIG, RT_SIGNAL_LEASE) == -1) {
perror("kernel lease set signal");
return -1;
}
/* l_type can be F_RDLCK F_WRLCK 加鎖*/
/* l_type can be F_UNLCK 解鎖*/
if(fcntl(diskfd, F_SETLEASE, l_type)){
perror("kernel lease set type");
return -1;
}
使用sendfile##### 從2.1版內核開始,Linux引入了sendfile來簡化操作:
#include
系統調用sendfile()在代表輸入文件的描述符in_fd和代表輸出文件的描述符out_fd之間傳送文件內容(字節)。描述符out_fd必須指向一個套接字,而in_fd指向的文件必須是可以mmap的。這些局限限制了sendfile的使用,使sendfile只能將數據從文件傳遞到套接字上,反之則不行。 sendfile系統調用過程 在我們調用sendfile時,如果有其它進程截斷了文件會發生什么呢?假設我們沒有設置任何信號處理程序,sendfile調用僅僅返回它在被中斷之前已經傳輸的字節數,errno會被置為success。如果我們在調用sendfile之前給文件加了鎖,sendfile的行為仍然和之前相同,我們還會收到RT_SIGNAL_LEASE的信號。 目前為止,我們已經減少了數據拷貝的次數了,但是仍然存在一次拷貝,就是頁緩存到socket緩存的拷貝。那么能不能把這個拷貝也省略呢? 借助于硬件上的幫助,我們是可以辦到的。之前我們是把頁緩存的數據拷貝到socket緩存中,實際上,我們僅僅需要把緩沖區描述符傳到socket緩沖區,再把數據長度傳過去,這樣DMA控制器直接將頁緩存中的數據打包發送到網絡中就可以了。 總結一下,sendfile系統調用利用DMA引擎將文件內容拷貝到內核緩沖區去,然后將帶有文件位置和長度信息的緩沖區描述符添加socket緩沖區去,這一步不會將內核中的數據拷貝到socket緩沖區中,DMA引擎會將內核緩沖區的數據拷貝到協議引擎中去,避免了最后一次拷貝。 帶DMA的sendfile 不過這一種收集拷貝功能是需要硬件以及驅動程序支持的。 使用splice##### sendfile只適用于將數據從文件拷貝到套接字上,限定了它的使用范圍。Linux在2.6.17版本引入splice系統調用,用于在兩個文件描述符中移動數據:
#define _GNU_SOURCE /* See feature_test_macros(7) */
#include
splice調用在兩個文件描述符之間移動數據,而不需要數據在內核空間和用戶空間來回拷貝。他從fd_in拷貝len長度的數據到fd_out,但是有一方必須是管道設備,這也是目前splice的一些局限性。flags參數有以下幾種取值:
splice調用利用了Linux提出的管道緩沖區機制, 所以至少一個描述符要為管道。 以上幾種零拷貝技術都是減少數據在用戶空間和內核空間拷貝技術實現的,但是有些時候,數據必須在用戶空間和內核空間之間拷貝。這時候,我們只能針對數據在用戶空間和內核空間拷貝的時機上下功夫了。Linux通常利用寫時復制(copy on write)來減少系統開銷,這個技術又時常稱作COW。 由于篇幅原因,本文不詳細介紹寫時復制。大概描述下就是:如果多個程序同時訪問同一塊數據,那么每個程序都擁有指向這塊數據的指針,在每個程序看來,自己都是獨立擁有這塊數據的,只有當程序需要對數據內容進行修改時,才會把數據內容拷貝到程序自己的應用空間里去,這時候,數據才成為該程序的私有數據。如果程序不需要對數據進行修改,那么永遠都不需要拷貝數據到自己的應用空間里。這樣就減少了數據的拷貝。寫時復制的內容可以再寫一篇文章了。。。 除此之外,還有一些零拷貝技術,比如傳統的Linux I/O中加上O_DIRECT標記可以直接I/O,避免了自動緩存,還有尚未成熟的fbufs技術,本文尚未覆蓋所有零拷貝技術,只是介紹常見的一些,如有興趣,可以自行研究,一般成熟的服務端項目也會自己改造內核中有關I/O的部分,提高自己的數據傳輸速率。 |
免責聲明:本站部分文章和圖片均來自用戶投稿和網絡收集,旨在傳播知識,文章和圖片版權歸原作者及原出處所有,僅供學習與參考,請勿用于商業用途,如果損害了您的權利,請聯系我們及時修正或刪除。謝謝!
始終以前瞻性的眼光聚焦站長、創業、互聯網等領域,為您提供最新最全的互聯網資訊,幫助站長轉型升級,為互聯網創業者提供更加優質的創業信息和品牌營銷服務,與站長一起進步!讓互聯網創業者不再孤獨!
掃一掃,關注站長網微信
當我們在共享網絡訪問的時候,可能會遇到提示指定的網絡名不再可用的問題,這可能是由于我們的共享網絡出現了錯誤,也可能是被共享的對象所拒絕了。指定的網絡名 ......
文/曹楊 原標題:誰還看電視? 爸爸戴一副老花鏡,媽媽戴一副近視鏡,一人坐在沙發,一人躺在床上,各自刷著自己關注的博主更新的短視頻。電視也許開著,但只是背景! ∵@樣的畫面,幾乎成了洛奇家的常 ...
1、首先進入到“百度”軟件中, 2、然后在其中輸入“百度識圖”, 3、之后點擊圖中的“開始使用”按鈕, 4、緊接著點擊右下角的“相冊”功能, 5、在相冊下 ......
圖片來源于簡書 文/郭開森 楊帆 陸玖財經準備開新欄目了,每周一創始人郭開森和楊帆合體郭德帆,對行業進行一些觀察和評論,第一篇我們仍是打算寫社區團購,這是當下最火的話題! 磉^陸玖財經做客的朋友們...
一、軟件沖突1、首先確認是否是應用程序沖突導致的。2、查看是否只有特定幾個游戲或應用會導致該問題。3、如果是應用沖突,那么只要卸載這些app就可以解決了。二 ......
電腦端:1、大家可以點擊右邊鏈接進入網頁版的百度網盤,進入之后點擊“去登錄”。https://pan.baidu.com/2、之后正確的輸入賬號密碼進行登錄就好啦。手機端:1 ......
一、N100對比intel i3 1、N100的跑分達到了147210分,這個數據可以達到i3的七代級別。 2、在跑分上也是超越了大部分的I3七代CPU,不過比I3八代要弱勢一些。 3 ......
在填寫一些項目申請書中,總是免不了要選擇一些數字,但是在方框中如何插入數字,該怎么辦呢?那么下面就由學習啦小編給大家分享下word在方框里輸入數字的技巧, ......
8月15日消息 上周,有媒體報道前身為百度圖片的“榴蓮”APP含有大量不雅視頻內容被用戶舉報。對此,百度圖片官方進行了回應,百度圖片表示已經對報道中所涉及的“生吃旋風哥”等爭議內容進行了下線處理。 此外,百度...
WPS Office手機版怎么加橫線?很多用戶還不知道WPS Office手機版怎么加橫線,WPS Office手機版怎么加橫線,WPS Office手機版怎么打橫線,WPS Office手機版怎么弄 ......
迅雷前綴是什么 答:迅雷前綴是(magnet:?xt=urn:btih:)括號里的就是了。 我們只要在這段文字之后輸入后續的內容,就可以創建下載鏈接了。 1、磁力鏈接不基于文 ......
一、內容特權。 1、半價點播。 許多站內視頻都需要付費觀看,而大會員用戶可以直接半價享受; 購買成功后的48h內無限次觀看。有部分的內容是只限在中國大陸內觀 ......
1、首先打開小米運動的“實驗室功能”。 2、接著點擊“門卡模擬”。 3、然后點擊“我知道了”。 4、最后貼近就可以刷卡成功了。...
答:華為P系列: 華為p40,華為p40plus,華為p50,華為p50e,華為p60 華為mate系列: 華為mate40,華為mate50,華為mate50e,華為mate60 華為nova系列: 華為n ......
近期有用戶反映,電腦在更新Windows 11 Insider Preview 25252.1000后,出現了應用和已壓縮的文件點擊毫無反應,拖拽都不行,只能從開始菜單打開的情況,這是怎 ......
可見單元格就是不包括隱藏或者篩選篩選后隱藏起來的單元格區域。方法:篩選或隱藏數據,復制需要粘貼的值,在目標單元格區域左上角的第一個單元格處右擊,選擇【 ......
答:驍龍8+更好。 驍龍7+gen2實際上就是驍龍8+的低配版本。 在一些其他的核心架構方面都是保持一致的,比如說CPU的架構、GPU的架構等等。 驍龍7+和驍龍8+具體 ......
文/黎明 一場針對中國互聯網巨頭的反壟斷風暴正在醞釀,而且這次動真格了! 11月10日,國家市場監管總局發布《關于平臺經濟領域的反壟斷指南(征求意見稿)》,要加大對互聯網巨頭涉嫌壟斷的調查和監管。 ...
win11系統如何釋放掉系統默認保留的存儲空間?一般情況下,Windows會保留一些存儲空間,以便設備獲得良好性能和成功更新。但是當出現系統盤儲存空間不足時,我們會將幾個G的保留空間釋放出來,以解燃眉之急。本期教...
文件被win10系統誤報病毒自動刪除了如何進行恢復?有用戶下載了某些破解軟件卻被Win10系統誤認為是病毒文件而自動刪除,當然系統自帶殺毒軟件其實挺不錯的,就是有時候會誤報,大家遇到這種情況的時候就希望把誤刪的...
1、先打開機頂盒進入主界面,并且使用遙控器打開設置。 2、然后選擇“賬號與安全”,并且進入。 3、最后往下面翻就可以看到“ADB調試”的選項,直接開啟就行了 ......
羅技g304dpi燈顏色代表什么:1、藍色:這種情況是正常工作的顯示,如果說是常亮或者閃爍,那都沒有問題這是在正常工作呢。2、紅色:如果說是紅燈閃爍的話那就是 ......
答:在3DMark壓力測試當中,顯卡需要超高97%才能夠算合格,證明顯卡的穩定性是過關的。 1、一般的默認情況下在2500~3000分就算很正常的了。 2、分數越高說明顯卡 ......
win11系統快速跳過聯網創建本地管理賬戶3種方法?現在市面上銷售的品牌筆記本和臺式機基本上都預裝Windows11家庭中文版正版操作系統,聯網后系統會自動激活。當用戶拿到新機器后還需要按照cortana(小娜)的提示一步...
答:中高端水平 i513500hx在處理器當中是處于一個中高端的水平。 i513500hx是第十一代酷睿處理器系列的一員,基礎頻率為2.4GHz,表現十分的不錯。 i513500hx介 ......
相信有非常多使用過筆記本的用戶都聽說過獨顯直連這個詞,但很多用戶并不了解獨顯直連是什么,又有什么用處,那么下面就和小編一起來看看什么是獨顯直連和開啟這 ......
我們經常用WPS的時候,如果需要輸入波浪號~,會發現鍵盤上的波浪號輸入之后在最上面,但是為了美觀,我們希望波浪號顯示在中間。這里總結了三個方法分享給大家 ......
win11系統開機總是自動登錄OneDrive如何關閉?win11系統開機的時候,會自動啟動OneDrive,不想要啟動,該怎么操作呢?下面我們就來看看詳細的教程。 在OneDrive界面點小齒輪按鈕,下拉菜單中點【設置】。 單擊【...
1、首先確認手機型號是否支持無線充電功能,(可以在品牌官網找到手機信息查看)2、查看充電板的指示燈是否亮起。指示燈不亮檢查充電器、數據線、電源之間連接是 ......