A reference to my work in Cricinfo
One of my hobbies these days is to build up my own statistical articles.I wrote a simple parser to extract information from the wonderful tool Cricinfo Statsguru and build up my own little database.I subsequently use this set of text files to generate my own information.
One of the work that was borne out of such an effort was this article.Thanks to Ananth ,the Cricinfo It figures blog editor who acknowledged my effort for the article.
The blog addresses the simple question how often have the same team played a particular match.This gives more answers with regards to the stability of the team.Now we extend that notion to n=10 ,meaning how often have the same 10 people played the game,it gives us more idea on which teams had a solid foundation of 10 similar people on more number of games.We can slowly extend the idea to n=9...so on till n=2 to give us more insights.Ofcourse the answer to n=1 is trivial and simply boils down to which player has made the most number of matches.
The question is interesting,the answer to this is tough to find given the large amount of data we need to parse through.
There have been 1944 test matches at the time of writing the article.Each test match contributes to 2 teams so 1944*2=3888 teams. For finding n=11 the most inefficient method is to compare team#1 with team#3888 and see if there is a match if so increment the count for that team.Basically a brute force algorithm where you compare one team with every other team.This is time consuming,and is not easily extendable for all n.
So I adapted the following generic algorithm.
Consider the solution for a particular n.Say n=6.
So in a particular team How many sets are there of size n=6 .The answer is 11 C 6 (11 Combination 6) i,e 462.So like this we will construct 462 such sets for each team.
462*3888 i.e about 1.8 million sets.Now basically see how many of these 1.8 million sets are matching and you have your count.
So the solution boils down ,given a set of 11 elements,construct all possible subsets of size 2 ,size3 and so on till size 11 and get count of each possible subset across all teams.Wrote a simple Java algorithm for the same and we are done.The whole thing took 2 mins to run.Once the results are out a simple unix script to sort it on country basis will give me the formatted results.
That is the long and short of the algorithm I used.
One of the work that was borne out of such an effort was this article.Thanks to Ananth ,the Cricinfo It figures blog editor who acknowledged my effort for the article.
The blog addresses the simple question how often have the same team played a particular match.This gives more answers with regards to the stability of the team.Now we extend that notion to n=10 ,meaning how often have the same 10 people played the game,it gives us more idea on which teams had a solid foundation of 10 similar people on more number of games.We can slowly extend the idea to n=9...so on till n=2 to give us more insights.Ofcourse the answer to n=1 is trivial and simply boils down to which player has made the most number of matches.
The question is interesting,the answer to this is tough to find given the large amount of data we need to parse through.
There have been 1944 test matches at the time of writing the article.Each test match contributes to 2 teams so 1944*2=3888 teams. For finding n=11 the most inefficient method is to compare team#1 with team#3888 and see if there is a match if so increment the count for that team.Basically a brute force algorithm where you compare one team with every other team.This is time consuming,and is not easily extendable for all n.
So I adapted the following generic algorithm.
Consider the solution for a particular n.Say n=6.
So in a particular team How many sets are there of size n=6 .The answer is 11 C 6 (11 Combination 6) i,e 462.So like this we will construct 462 such sets for each team.
462*3888 i.e about 1.8 million sets.Now basically see how many of these 1.8 million sets are matching and you have your count.
So the solution boils down ,given a set of 11 elements,construct all possible subsets of size 2 ,size3 and so on till size 11 and get count of each possible subset across all teams.Wrote a simple Java algorithm for the same and we are done.The whole thing took 2 mins to run.Once the results are out a simple unix script to sort it on country basis will give me the formatted results.
That is the long and short of the algorithm I used.
33 Comments:
[B]NZBsRus.com[/B]
Escape Slow Downloads With NZB Downloads You Can Hastily Search High Quality Movies, PC Games, MP3 Singles, Software and Download Them at Flying Rates
[URL=http://www.nzbsrus.com][B]Usenet[/B][/URL]
Making money on the internet is easy in the undercover world of [URL=http://www.www.blackhatmoneymaker.com]blackhat forums[/URL], Don’t feel silly if you have no clue about blackhat marketing. Blackhat marketing uses alternative or not-so-known avenues to generate an income online.
モバゲーを使って恋人を探そう!大人気のモバゲーならゲームを知らなくてもすぐに恋人ができちゃうんです
マイナーな芸能人とかは、メジャー前に生活費稼ぎにAVや画像が流出してます。ココ流出画像サイトに登録されてるマイナーな芸能人なら、直ぐ股を開く女ばかりですよ。この機会に芸能人を喰ちゃいましょう
第71回 菊花賞 2010 今年の波乱を大予想!出走馬の厳選された情報だけを公開…気になるアノ馬の仕上がり具合とは?さらにオッズやデータを分析し、必勝買い目を導き出す!
菊花賞 2010 予想 オッズには抜け穴がある…現場スタッフによるデータ収集、さらに血統に関しても徹底して分析済み!出走馬の調整、展開を完全に読みきる!優良サイトをランキング形式で大公開!
菊花賞 2010 予想 オッズには抜け穴がある…現場スタッフによるデータ収集、さらに血統に関しても徹底して分析済み!出走馬の調整、展開を完全に読みきる!優良サイトをランキング形式で大公開!
神待ち少女を助けられるのは貴方しかいません。是非近所でウロウロしている少女を助けてあげてください。
第142回 天皇賞 秋 2010 予想 出走馬の調子とオッズの矛盾を比較。仕組まれた枠順・・・JRAの裏情報を独占入手!一般には漏れないデータを極秘公開。昨年は3連単的中、今年も鉄板買い目で勝負を挑み結果につなげる
第142回 天皇賞 秋 2010 今年の波乱を大予想!出走馬の厳選された情報だけを公開…気になるアノ馬の仕上がり具合とは?さらにオッズやデータを分析し、必勝買い目を導き出す!結果につなげるのはあなた次第!
第35回 エリザベス女王杯 2010 今年の波乱を大予想!出走馬の厳選された情報だけを公開…気になるアノ馬の仕上がり具合とは?さらにオッズやデータを分析し、必勝買い目を導き出す!
神待ち少女を助けられるのは貴方しかいません。是非近所でうろうろしている少女を助けてあげてください。
ニューハーフと出会える新感覚出会いBBSが誕生しました!ニューハーフと逢いたい男性、恋人が欲しいニューハーフさんは当サイトに今すぐ参加しよう
海賊王に俺はなるで有名なワンピース。質問に答えるだけで、自分がどのキャラと同じタイプかが分かり話が盛り上がる事間違いなし!!性別関係なくいつでも楽しめる事間違いないよ。結果が道化のバギーで笑いが取れるかも
ご近所の神待ち・家出少女と遊びませんか?コミュニティには少女たちの書き込みで溢れています
ジャパンカップ 競馬 2010の最新情報・馬場状態を徹底分析!過去のデータから見抜ける勝ち馬の秘訣とは!?枠順からみたレース展開…最後に笑うのはどの馬なのか…裏情報満載でお届け!
第30回 ジャパンカップ 2010 予想 オッズを徹底分析!出走馬の状態から現地の状態まで、全てを網羅したデータが集約!!過去の勝ち馬から見抜いた勝てる馬の法則とは!?裏情報と共に大公開
第30回 ジャパンカップ 2010 予想 オッズには抜け穴がある・・・現場スタッフによるデータ収集、さらに血統に関しても徹底して分析済み!出走馬の調整、展開を完全に読みきる!裏情報を独占公開
流出画像、レアなお宝、ハプニング画像が満載!無料登録のみでお宝が取り放題♪
今年のクリスマスも後少しですね。グリー内でもクリスマスに備えて異性と交流を持つコミュニティが活発で、自分も今年のクリスマスにお陰で間に合いました!!みなさんもイブを一人で過ごさなくても良いように、グリーで異性をGETしよう
出会いSNS【ふみコミュ】で楽しく遊んでみませんか?当サイトのオススメ機能を紹介しながら当サイトの魅力を大公開!!
もし自分がワンピースの世界に登場したらって、思ったことないですか?このサイトの質問の答えから、自分ならどんな海賊になるのかを答えてくれますよ。ワンピースブームの今なら、話題づくりに持って来いのサイトですよ。やっぱり一番人気はチョッパーかな
第62回 朝日杯フューチュリティステークス 2010 人気に左右されないレース独自の傾向があった!自社独自に集めた豊富なデータから導かれた予想を大公開
デコログでちょっとした出会いができちゃいます。友達を作りたい人や恋人募集中の人などが集まる当サイト!出会えること間違いなし!!
ワンピース好きは沢山いると思いますが、自分はワンピースが一番好きだっと言う猛者は、この質問に答えてみてほしい!!診断結果によりワンピース好きランクが分かるぞ。さて中途半端なブルック級と出るか、海賊王級と出るかはあなた次第
有馬記念 2010 過去のデータから共通する勝ち馬の法則!!注目馬や穴馬などの最新情報を随時公開!
日本でも最大級のクルーズ ブログで、クリスマスを一緒に過ごす相手を見つけませんか?業者排除システムを搭載しているから、安心安全に異性を見つけれますよ。この機会にみなさんも参加しませんか?気になる異性がいたら直メ直電で即ゲット出来ますよ
芸能人と仲良くなれちゃうコミュニティ デコログ(DECOLOG)誕生☆今よりももっとずっと、楽しい♪を見つけちゃおう
有馬記念 2010を徹底予想!気になる枠順やオッズ情報はもちろん、今年は確実に当てにいきます
もう年末でお酒の席も増えてると思いますが、こんな時こそ自分のモテ度をさり気無くチェック出来るのが、モテる度チェッカーです。診断結果にはモテる為のアドバイス付き!!これで君もヤリチンの仲間入り
冬休みを利用してのプチ家出中の少女が集う家出掲示板登場!困っている彼女達を救えるのはアナタしかいません。もちろん救ってあげた貴方の好きなようにして下さい。救ってもらった負い目が有るから性奴隷も思いのまま
facebookでは様々な出会いや新たな仲間を探すことができる出会いのソーシャルネットワークサービスです。facebookを通じて新しい出会いをたくさん見つけましょう。あなたにぴったりの人と出会えるはず!
誰もが知ってる代表的アニメのドラゴンボール。もし自分がドラゴンボールのキャラなら誰になるのか気になりませんか?潜在能力を分析するので自分では気付かなかった秘められたパワーに目覚めるかも!
Post a Comment
Subscribe to Post Comments [Atom]
<< Home