Item-to-Item Collaborative Filtering

Matching user’s purchased and rated items to similar items à similar-items table

Identify similarities between different items

Items more static than users

Offline: Item similarity computation

Online: Prediction computation






Tagging Systems

What is Tagging?

keyword, description, classification, user-based, collaboration, easy, linear thinking, flickr, del.icio.us, hotissue, muststudy

Best examples: flickr, del.icio.us, gmail, technorati

Goals: organizing, sharing, navigating, filtering, searching, etc

Taxonomy vs. Folksonomy

Taxonomy: hierarchical & exclusive

Folksonomy(by tagging): non-hierarchical & inclusive

Automatic annotation vs. Tagging

Automatic annotation: content-based & good for only text

Tagging: context-based & good for multimedia data


Kinds of Tags
1.Identifying What it is About

ex) ajax, cat, mountain, etc

2.Identifying What it Is

ex) article, blog, book, etc

3.Identifying Who Owns It

ex) MichaelArrington, DionHinchcliffe, etc

4.Refining Categories

ex) 25, 100, etc

5.Identifying Qualities or Characteristics

ex) funny, stupid, interesting, inspiration

6.Self Reference

ex) mystuff, mycomments, etc

7.Task Organizing

ex) toread, jobsearch, musthave, etc


Unified User-Resource-Relation Model Analysis for Tagging




The Philosophy of Collaborative Tag Suggestion

Selecting good tags

High popularity à tag quality

High coverage of multiple facets à good recall

Least effort à reduce the cost involved in browsing

Eliminating tag spam

Utilizing collective user tagging behavior and authorities 


Collaborative Tag Suggestion Algorithm

S(t’,o) = S(t’,o) + Ps(t’|ti;o) x S(ti,o) – Pa(t’|ti) x S(ti,o)

Ps(t’|ti;o) : correlation probability between t’ and ti for the object o

Pa(t’|ti) : overlap probability in terms of the concepts between t’ and ti

S(t’,o) : goodness measure (score) of the tag t’ to an object o

a(u) : authority score of a given user u



Experiments based on Yahoo My Web 2.0 tag data

Suggested Tags for the

URLhttp://wiki.osfoundation.org/bin/view/Projects/AjaxLibraries



The Philosophy of PageRank

PageRank relies on the uniquely democratic nature of the web by using its vast link structure as anindicator of an individual page's value. In essence, Google interprets a linkfrom page A to page B as a vote, by page A, for page B. But, Google looks at more than thesheer volume of votes, or links a page receives; it also analyzes the page thatcasts the vote. Votes cast by pages that are themselves "important"weigh more heavily and help to make other pages "important."


PageRank Algorithm


PR(A) : PageRank of page A

L(A) : The number of links going out of page A

d : damping factor


image '아이언맨' '배트맨'(오른쪽) <사진출처=영화스틸>

이제 히어로가 되기 위해서 의협심 말고도 필요한 것이 있다. 개봉을 앞둔 '아이언맨2'와 북미에서 흥행돌풍 중인 '킥 애스 : 영웅의 탄생'은 모두 초능력 없이 겉으로 평범한 이들이 영웅이 되는 이야기다.

이들이 영웅이 되기 위해 필요한 것은 돈. 일반인은 상상하기 힘든 돈으로 무기를 사고 영웅이 되기 위해 준비한다. 앞서 이들의 형님뻘인 배트맨이 돈과 의협심이 있으면 영웅이 될 수 있음을 보여줬다. 대표적인 거부인 아이언맨과 배트맨, 둘 중에 누가 진정한 부자일까. 

세월의 흐름에 따라 부자의 순위도 바뀐다. 이는 슈퍼 히어로들도 크게 다르지 않다. 변하는 국제 정세에 맞춰 자신의 자산을 잘 관리해야 하는 건 '부자 히어로'의 또 다른 숙명이다. 

미국의 경제잡지 포브스의 집계에 따르면 '아이언맨'인 토니 스타크는 2008년에 재산이 30억 달러에 그쳤으나 최근 88억 달러로 증가했다. '배트맨' 브루스 웨인은 2008년 68억 달러였고, 2010년에는 65억 달러로 재산상 큰 변화가 없다. 

이 같이 '아이언맨'의 토니 스타크가 불안한 국제 정세에도 불구하고 재산이 급증한 것은 무엇 때문일까? 이는 바로 토니 스타크가 자신이 아이언맨이라고 밝혔기 때문이다. 아이언맨이 세계를 보호함에 따라 회사의 주가도 크게 상승했다. 

이 같은 이유는 '아이언맨2'에서도 등장한다. 페퍼 포츠(기네스 펠트로우 분)가 회사가 너무 힘들다고 말하자 토니는 "무슨 소리냐? 아이언맨 덕분에 주가는 역대 최고를 기록하고 있다"고 반문한다. 

부동산적인 투자 관점에서도 아이언맨이 배트맨보다 앞선다. '아이언맨' 토니 스타크의 집은 할리우드 스타들의 별장이 늘어선 미국 LA의 말리부에 위치한다. 바닷가가 보이는 언덕위에 위치해 최고의 절경을 바라볼 수 있다. 아침햇살이 따뜻하게 비치는 것은 물론이다. 

'배트맨' 브루스 웨인이 사는 고담시는 범죄가 끊이지 않는 곳. 브루스 웨인은 도시에서 멀찌감치 떨어진 곳에 산다. 아름다운 경관을 즐기기보다 조용히 산책하기 좋은 곳이라 할 수 있다.

하지만 이 같은 부자 순위는 또 다시 바뀔지 모른다. 그것은 토니 스타크가 브루스 웨인보다 무분별하게 돈을 쓰기 때문이다. 

특히 아이언맨은 싸움이 끝날 때마다 고가의 수트를 자비로 수리해야 하는 것도 이유 중 하나다. 또 몸에 남아 있는 폭탄의 파편 때문에 꾸준히 바꿔줘야 하는 아크 원자 때문에 추가 비용 지출이 예상된다.

+ Recent posts