First Day,First Show.Last Word.Full Stop.

Movie Reviews.Mostly Tamil.Occasional Telugu.Rare Hindi.English episodic. Foreign Seldom.Cricket Trivia In The Gaps.



Monday, January 04, 2010

A reference to my work in Cricinfo

One of my hobbies these days is to build up my own statistical articles.I wrote a simple parser to extract information from the wonderful tool Cricinfo Statsguru and build up my own little database.I subsequently use this set of text files to generate my own information.

One of the work that was borne out of such an effort was this article.Thanks to Ananth ,the Cricinfo It figures blog editor who acknowledged my effort for the article.

The blog addresses the simple question how often have the same team played a particular match.This gives more answers with regards to the stability of the team.Now we extend that notion to n=10 ,meaning how often have the same 10 people played the game,it gives us more idea on which teams had a solid foundation of 10 similar people on more number of games.We can slowly extend the idea to on till n=2 to give us more insights.Ofcourse the answer to n=1 is trivial and simply boils down to which player has made the most number of matches.

The question is interesting,the answer to this is tough to find given the large amount of data we need to parse through.
There have been 1944 test matches at the time of writing the article.Each test match contributes to 2 teams so 1944*2=3888 teams. For finding n=11 the most inefficient method is to compare team#1 with team#3888 and see if there is a match if so increment the count for that team.Basically a brute force algorithm where you compare one team with every other team.This is time consuming,and is not easily extendable for all n.

So I adapted the following generic algorithm.

Consider the solution for a particular n.Say n=6.
So in a particular team How many sets are there of size n=6 .The answer is 11 C 6 (11 Combination 6) i,e 462.So like this we will construct 462 such sets for each team.
462*3888 i.e about 1.8 million sets.Now basically see how many of these 1.8 million sets are matching and you have your count.
So the solution boils down ,given a set of 11 elements,construct all possible subsets of size 2 ,size3 and so on till size 11 and get count of each possible subset across all teams.Wrote a simple Java algorithm for the same and we are done.The whole thing took 2 mins to run.Once the results are out a simple unix script to sort it on country basis will give me the formatted results.

That is the long and short of the algorithm I used.


Anonymous Anonymous said...

Escape Slow Downloads With NZB Downloads You Can Hastily Search High Quality Movies, PC Games, MP3 Singles, Software and Download Them at Flying Rates


10:28 PM  
Anonymous Anonymous said...

Making money on the internet is easy in the undercover world of [URL=]blackhat forums[/URL], Don’t feel silly if you have no clue about blackhat marketing. Blackhat marketing uses alternative or not-so-known avenues to generate an income online.

3:19 AM  
Anonymous モバゲー said...


9:27 PM  
Anonymous 流出画像 said...


8:08 PM  
Anonymous 菊花賞 2010 said...

第71回 菊花賞 2010 今年の波乱を大予想!出走馬の厳選された情報だけを公開…気になるアノ馬の仕上がり具合とは?さらにオッズやデータを分析し、必勝買い目を導き出す!

7:51 PM  
Anonymous 菊花賞 said...

菊花賞 2010 予想 オッズには抜け穴がある…現場スタッフによるデータ収集、さらに血統に関しても徹底して分析済み!出走馬の調整、展開を完全に読みきる!優良サイトをランキング形式で大公開!

9:06 PM  
Anonymous 菊花賞 said...

菊花賞 2010 予想 オッズには抜け穴がある…現場スタッフによるデータ収集、さらに血統に関しても徹底して分析済み!出走馬の調整、展開を完全に読みきる!優良サイトをランキング形式で大公開!

9:07 PM  
Anonymous 神待ち said...


8:51 PM  
Anonymous 天皇賞 秋 said...

第142回 天皇賞 秋 2010 予想 出走馬の調子とオッズの矛盾を比較。仕組まれた枠順・・・JRAの裏情報を独占入手!一般には漏れないデータを極秘公開。昨年は3連単的中、今年も鉄板買い目で勝負を挑み結果につなげる

8:02 PM  
Anonymous 天皇賞 秋 2010 said...

第142回 天皇賞 秋 2010 今年の波乱を大予想!出走馬の厳選された情報だけを公開…気になるアノ馬の仕上がり具合とは?さらにオッズやデータを分析し、必勝買い目を導き出す!結果につなげるのはあなた次第!

7:30 PM  
Anonymous エリザベス女王杯 2010 said...

第35回 エリザベス女王杯 2010 今年の波乱を大予想!出走馬の厳選された情報だけを公開…気になるアノ馬の仕上がり具合とは?さらにオッズやデータを分析し、必勝買い目を導き出す!

8:18 PM  
Anonymous 神待ち said...


8:13 PM  
Anonymous ニューハーフ said...


9:58 PM  
Anonymous ワンピース said...


10:13 PM  
Anonymous 神待ち said...


6:55 PM  
Anonymous ジャパンカップ 競馬 said...

ジャパンカップ 競馬 2010の最新情報・馬場状態を徹底分析!過去のデータから見抜ける勝ち馬の秘訣とは!?枠順からみたレース展開…最後に笑うのはどの馬なのか…裏情報満載でお届け!

8:13 PM  
Anonymous ジャパンカップ 2010 said...

第30回 ジャパンカップ 2010 予想 オッズを徹底分析!出走馬の状態から現地の状態まで、全てを網羅したデータが集約!!過去の勝ち馬から見抜いた勝てる馬の法則とは!?裏情報と共に大公開

8:04 PM  
Anonymous ジャパンカップ said...

第30回 ジャパンカップ 2010 予想 オッズには抜け穴がある・・・現場スタッフによるデータ収集、さらに血統に関しても徹底して分析済み!出走馬の調整、展開を完全に読みきる!裏情報を独占公開

6:40 PM  
Anonymous 流出画像 said...


6:59 PM  
Anonymous グリー said...


10:03 PM  
Anonymous ふみコミュ said...


6:59 PM  
Anonymous ワンピース said...


8:14 PM  
Anonymous 朝日杯フューチュリティステークス said...

第62回 朝日杯フューチュリティステークス 2010 人気に左右されないレース独自の傾向があった!自社独自に集めた豊富なデータから導かれた予想を大公開

8:32 PM  
Anonymous デコログ said...


8:50 PM  
Anonymous ワンピース said...


8:49 PM  
Anonymous 有馬記念 2010 said...

有馬記念 2010 過去のデータから共通する勝ち馬の法則!!注目馬や穴馬などの最新情報を随時公開!

8:13 PM  
Anonymous クルーズ ブログ said...

日本でも最大級のクルーズ ブログで、クリスマスを一緒に過ごす相手を見つけませんか?業者排除システムを搭載しているから、安心安全に異性を見つけれますよ。この機会にみなさんも参加しませんか?気になる異性がいたら直メ直電で即ゲット出来ますよ

6:49 PM  
Anonymous デコログ said...

芸能人と仲良くなれちゃうコミュニティ デコログ(DECOLOG)誕生☆今よりももっとずっと、楽しい♪を見つけちゃおう

6:26 PM  
Anonymous 有馬記念 said...

有馬記念 2010を徹底予想!気になる枠順やオッズ情報はもちろん、今年は確実に当てにいきます

6:49 PM  
Anonymous モテる度チェッカー said...


7:15 PM  
Anonymous プチ家出 said...


7:13 PM  
Anonymous facebook said...


7:05 PM  
Anonymous ドラゴンボール said...


6:13 PM  

Post a Comment

Subscribe to Post Comments [Atom]

<< Home