国产一区二区精品久久_蜜桃狠狠狠狠狠狠狠狠狠_午夜视频精品_激情都市一区二区

當前位置:首頁 > 網(wǎng)站舊欄目 > 學習園地 > 設計軟件教程 > 使用Erlang Profile工具進行性能分析

使用Erlang Profile工具進行性能分析
2010-01-13 23:19:21  作者:  來源:
Erlang tools lib中包含三個用于性能分析的工具:cprof,eporf和fprof。
cprof 提供函數(shù)調(diào)用計數(shù),其對系統(tǒng)的性能影響最小
eprof 提供函數(shù)運行時間的百分比
fprof 通過將trace存儲到文件,提供函數(shù)調(diào)用計數(shù)及運行時間統(tǒng)計信息

這里我們主要介紹fprof,首先其提供的信息最為詳細,其次因為將trace存儲到文件中,我們可以進行較長運行時間的性能分析

fprof使用

1,fprof:start().
2,
Erlang代碼 復制代碼
  1. fprof:apply   
  2. fprof:profile   
  3. fprof:analyse   
     
OR  
Erlang代碼 復制代碼
  1. fprof:trace(start)   
  2. fprof:trace(stop)   
  3. fprof:profile   
  4. fprof:analyse  

apply在函數(shù)開始的時候進行fprof:trace(start, ..),在函數(shù)結(jié)束的時候執(zhí)行fprof:trace(stop).上面三個函數(shù)都有很多可選參數(shù),默認情況下,使用下面文件保存各階段信息:fprof.trace, fprof.profile,fprof.analysis
  
fprof Analysis format
產(chǎn)生了分析報告,最重要的就是如何閱讀了。

讓我們寫一個簡單的例子:
Erlang代碼 復制代碼
  1. -module(bar).   
  2. -export([test/1]).   
  3.   
  4. test(N) when is_integer(N) ->       
  5.     L = lists:seq(1, N),   
  6.     L2 = lists:map(fun(E) -> E * 2 end, L),   
  7.     _L3 = lists:splitwith(fun(E) -> E rem 2 =:= 0 end, L2),   
  8.     ok.  


進行profiling

Erlang代碼 復制代碼
  1. > c(bar).   
  2. > fprof:apply(bar, test, [1000]).   
  3. > fprof:profile().   
  4. > fprof:analyse({dest, "bar.analysis"}).   
  5. Processing data...   
  6. Creating output...   
  7. Done!   
  8. ok  


analysis結(jié)果已經(jīng)保存到bar.analysis中,此文件可以通過erl_scan and erl_parse, file:consult/1 or io:read/2進行讀取分析。

下面我們看看analysis內(nèi)容:
引用

%% Analysis results:
{  analysis_options,
[{callers, true},
  {sort, acc},
  {totals, false},
  {details, true}]}.

%                                               CNT       ACC       OWN       
[{ totals,                                     5019,   18.886,   18.884}].  %%%
 


CNT表示總的函數(shù)調(diào)用次數(shù),ACC表示Trace起始經(jīng)歷的時間,OWN是Trace中所有函數(shù)執(zhí)行的時間和(不包含調(diào)用函數(shù)的執(zhí)行時間),我們這個例子中OWN和ACC比較接近,因為我們這里在啟動trace后就立即開始了函數(shù)調(diào)用,沒有進行其他特殊的工作。這里時間的單位為ms。

引用

%                                               CNT       ACC       OWN       
[{ "<0.82.0>",                                 5019,undefined,   18.884}].   %%
 

這里表示一個process的開始,在我們這個例子中我們調(diào)用fprof:apply/3開始進行trace,因此這個Pid其實就是我們調(diào)用apply所在的Process,我們沒有Spawn新的Process,所以這里的CNT,OWN和totals相同。ACC的值為undefined,這是因為這個數(shù)值對于我們沒有什么意義,我們可以通過totals計算出這個數(shù)值。
請注意此行結(jié)尾處的 “%%”表明一個process的開始

引用

{[{undefined,                                     0,   18.886,    0.002}],    
{ {fprof,apply_start_stop,4},                    0,   18.886,    0.002},     %
[{{bar,test,1},                                  1,   18.884,    0.004},     
  {suspend,                                       1,    0.000,    0.000}]}.   

{[{{fprof,apply_start_stop,4},                    1,   18.884,    0.004}],    
{ {bar,test,1},                                  1,   18.884,    0.004},     %
[{{lists,map,2},                                 1,   14.859,   12.352},     
  {{lists,splitwith,2},                           1,    3.012,    0.001},     
  {{lists,seq,2},                                 1,    1.009,    0.001}]}.   
 

analysis內(nèi)容通過空行,間隔成不同的段落。

每個段落中尾部以"%"標記的行為這個段落的標記行。比如上面的內(nèi)容中{bar,test,1}所在行為一個關鍵行,此行上面的List為所有調(diào)用bar:test/1的函數(shù)列表(called list),此行下面的List為bar:test/1調(diào)用的函數(shù)列表(calling list)。

所有的段落按照ACC遞減的順序排列,同時段落內(nèi)部的called list和calling list也是按照這個規(guī)則排列。

CNT為對應函數(shù)累計調(diào)用次數(shù),ACC為此函數(shù)消耗時間包含其調(diào)用的函數(shù),OWN為此函數(shù)自身消耗時間不包含called函數(shù)。即:
ACC(marked) = OWN(marked) + ACC(calling fun 1) + ACC(calling fun 2) ... ACC(calling fun N)
讓我們看看上面的內(nèi)容中,{bar,test,1}其ACC為:
18.884 = 0.004 + 14.859 + 3.012 + 1.009
同時{bar,test,1}作為我們module的入口其ACC為18.884等于所在process對應的OWN時間。

其實看到這里,我們已經(jīng)明白,我們這個module中{lists,map,2}最耗時,其占用79% (14.859/18.880)時間,{lists,splitwith,2}占用16% (3.012/18.880) 的時間,而{lists,seq,2} (1.009%18.880) 只占用5%左右。

引用

{[{{bar,test,1},                                  1,   14.859,   12.352},     
  {{lists,map,2},                              1000,    0.000,    1.502}],    
{ {lists,map,2},                              1001,   14.859,   13.854},     %
[{{bar,'-test/1-fun-0-',1},                   1000,    1.002,    1.001},     
  {garbage_collect,                               2,    0.002,    0.002},     
  {suspend,                                       1,    0.001,    0.000},     
  {{lists,map,2},                              1000,    0.000,    1.502}]}.   

接下來就是依次分析所有的被調(diào)用函數(shù),這里說明{lists,map,2}被兩個函數(shù)調(diào)用:
{bar,test,1}和{lists,map,2},也許你有疑問了,在bar:test/1中的確調(diào)用了lists:map/2依次,可是我的代碼中沒有用lists:map/2調(diào)用lists:map/2啊,看看stdlib/src/lists.erl代碼,你就會明白,lists:map/2是遞歸方式調(diào)用,所以bar module中調(diào)用了1次,而我們的List長度是1000,所以lists:map/2函數(shù)就被調(diào)用了 1 + 1000 = 1001次哦。然后marked行下面就是lists:map/2調(diào)用的函數(shù)列表。

bar.analysis接下的部分,是對每個函數(shù)的分析,如果某個函數(shù)為BIF,沒有調(diào)用任何其他函數(shù),那么其對應的輸出內(nèi)容為:
引用

{[{{lists,reverse,1},                             1,    0.001,    0.001}],    
{ {lists,reverse,2},                             1,    0.001,    0.001},     %
[ ]}.
 

恩,我們lists:reverse/2是BIF,毫無疑問。

在結(jié)果中出現(xiàn)了suspend,這是一個pseudo函數(shù),用來說明我們的process此刻處于中止狀態(tài),為什么會處于中止狀態(tài)?我們沒有調(diào)用erlang:yield/0,也沒有調(diào)用receive相關的函數(shù),怎么中止了呢?這里是Erlang虛擬機調(diào)度的結(jié)果,suspend函數(shù)對應的ACC時間總是為0,要不要把真正的suspend時間顯示出來,這是一個值得爭論的問題。
同樣的還有garbage_collect函數(shù),其OWN和ACC相同,這里我們把garbage_collect計入了運行時間。
 

安徽新華電腦學校專業(yè)職業(yè)規(guī)劃師為你提供更多幫助【在線咨詢