国产一区二区精品久久_蜜桃狠狠狠狠狠狠狠狠狠_午夜视频精品_激情都市一区二区

當前位置:首頁 > 網站舊欄目 > 學習園地 > 設計軟件教程 > 使用Erlang Profile工具進行性能分析

使用Erlang Profile工具進行性能分析
2010-01-13 23:19:21  作者:  來源:
Erlang tools lib中包含三個用于性能分析的工具:cprof,eporf和fprof。
cprof 提供函數調用計數,其對系統的性能影響最小
eprof 提供函數運行時間的百分比
fprof 通過將trace存儲到文件,提供函數調用計數及運行時間統計信息

這里我們主要介紹fprof,首先其提供的信息最為詳細,其次因為將trace存儲到文件中,我們可以進行較長運行時間的性能分析

fprof使用

1,fprof:start().
2,
Erlang代碼 復制代碼
  1. fprof:apply   
  2. fprof:profile   
  3. fprof:analyse   
     
OR  
Erlang代碼 復制代碼
  1. fprof:trace(start)   
  2. fprof:trace(stop)   
  3. fprof:profile   
  4. fprof:analyse  

apply在函數開始的時候進行fprof:trace(start, ..),在函數結束的時候執行fprof:trace(stop).上面三個函數都有很多可選參數,默認情況下,使用下面文件保存各階段信息:fprof.trace, fprof.profile,fprof.analysis
  
fprof Analysis format
產生了分析報告,最重要的就是如何閱讀了。

讓我們寫一個簡單的例子:
Erlang代碼 復制代碼
  1. -module(bar).   
  2. -export([test/1]).   
  3.   
  4. test(N) when is_integer(N) ->       
  5.     L = lists:seq(1, N),   
  6.     L2 = lists:map(fun(E) -> E * 2 end, L),   
  7.     _L3 = lists:splitwith(fun(E) -> E rem 2 =:= 0 end, L2),   
  8.     ok.  


進行profiling

Erlang代碼 復制代碼
  1. > c(bar).   
  2. > fprof:apply(bar, test, [1000]).   
  3. > fprof:profile().   
  4. > fprof:analyse({dest, "bar.analysis"}).   
  5. Processing data...   
  6. Creating output...   
  7. Done!   
  8. ok  


analysis結果已經保存到bar.analysis中,此文件可以通過erl_scan and erl_parse, file:consult/1 or io:read/2進行讀取分析。

下面我們看看analysis內容:
引用

%% Analysis results:
{  analysis_options,
[{callers, true},
  {sort, acc},
  {totals, false},
  {details, true}]}.

%                                               CNT       ACC       OWN       
[{ totals,                                     5019,   18.886,   18.884}].  %%%
 


CNT表示總的函數調用次數,ACC表示Trace起始經歷的時間,OWN是Trace中所有函數執行的時間和(不包含調用函數的執行時間),我們這個例子中OWN和ACC比較接近,因為我們這里在啟動trace后就立即開始了函數調用,沒有進行其他特殊的工作。這里時間的單位為ms。

引用

%                                               CNT       ACC       OWN       
[{ "<0.82.0>",                                 5019,undefined,   18.884}].   %%
 

這里表示一個process的開始,在我們這個例子中我們調用fprof:apply/3開始進行trace,因此這個Pid其實就是我們調用apply所在的Process,我們沒有Spawn新的Process,所以這里的CNT,OWN和totals相同。ACC的值為undefined,這是因為這個數值對于我們沒有什么意義,我們可以通過totals計算出這個數值。
請注意此行結尾處的 “%%”表明一個process的開始

引用

{[{undefined,                                     0,   18.886,    0.002}],    
{ {fprof,apply_start_stop,4},                    0,   18.886,    0.002},     %
[{{bar,test,1},                                  1,   18.884,    0.004},     
  {suspend,                                       1,    0.000,    0.000}]}.   

{[{{fprof,apply_start_stop,4},                    1,   18.884,    0.004}],    
{ {bar,test,1},                                  1,   18.884,    0.004},     %
[{{lists,map,2},                                 1,   14.859,   12.352},     
  {{lists,splitwith,2},                           1,    3.012,    0.001},     
  {{lists,seq,2},                                 1,    1.009,    0.001}]}.   
 

analysis內容通過空行,間隔成不同的段落。

每個段落中尾部以"%"標記的行為這個段落的標記行。比如上面的內容中{bar,test,1}所在行為一個關鍵行,此行上面的List為所有調用bar:test/1的函數列表(called list),此行下面的List為bar:test/1調用的函數列表(calling list)。

所有的段落按照ACC遞減的順序排列,同時段落內部的called list和calling list也是按照這個規則排列。

CNT為對應函數累計調用次數,ACC為此函數消耗時間包含其調用的函數,OWN為此函數自身消耗時間不包含called函數。即:
ACC(marked) = OWN(marked) + ACC(calling fun 1) + ACC(calling fun 2) ... ACC(calling fun N)
讓我們看看上面的內容中,{bar,test,1}其ACC為:
18.884 = 0.004 + 14.859 + 3.012 + 1.009
同時{bar,test,1}作為我們module的入口其ACC為18.884等于所在process對應的OWN時間。

其實看到這里,我們已經明白,我們這個module中{lists,map,2}最耗時,其占用79% (14.859/18.880)時間,{lists,splitwith,2}占用16% (3.012/18.880) 的時間,而{lists,seq,2} (1.009%18.880) 只占用5%左右。

引用

{[{{bar,test,1},                                  1,   14.859,   12.352},     
  {{lists,map,2},                              1000,    0.000,    1.502}],    
{ {lists,map,2},                              1001,   14.859,   13.854},     %
[{{bar,'-test/1-fun-0-',1},                   1000,    1.002,    1.001},     
  {garbage_collect,                               2,    0.002,    0.002},     
  {suspend,                                       1,    0.001,    0.000},     
  {{lists,map,2},                              1000,    0.000,    1.502}]}.   

接下來就是依次分析所有的被調用函數,這里說明{lists,map,2}被兩個函數調用:
{bar,test,1}和{lists,map,2},也許你有疑問了,在bar:test/1中的確調用了lists:map/2依次,可是我的代碼中沒有用lists:map/2調用lists:map/2啊,看看stdlib/src/lists.erl代碼,你就會明白,lists:map/2是遞歸方式調用,所以bar module中調用了1次,而我們的List長度是1000,所以lists:map/2函數就被調用了 1 + 1000 = 1001次哦。然后marked行下面就是lists:map/2調用的函數列表。

bar.analysis接下的部分,是對每個函數的分析,如果某個函數為BIF,沒有調用任何其他函數,那么其對應的輸出內容為:
引用

{[{{lists,reverse,1},                             1,    0.001,    0.001}],    
{ {lists,reverse,2},                             1,    0.001,    0.001},     %
[ ]}.
 

恩,我們lists:reverse/2是BIF,毫無疑問。

在結果中出現了suspend,這是一個pseudo函數,用來說明我們的process此刻處于中止狀態,為什么會處于中止狀態?我們沒有調用erlang:yield/0,也沒有調用receive相關的函數,怎么中止了呢?這里是Erlang虛擬機調度的結果,suspend函數對應的ACC時間總是為0,要不要把真正的suspend時間顯示出來,這是一個值得爭論的問題。
同樣的還有garbage_collect函數,其OWN和ACC相同,這里我們把garbage_collect計入了運行時間。
 

安徽新華電腦學校專業職業規劃師為你提供更多幫助【在線咨詢