Birds Flocking, Predictive Analytics and Online Social Communities




https://www.googletagmanager.com/ns.html?id=GTM-P9BT4Q3

Why can pigeon species fly as an ordered parade? How can ant colonies find the shortest way to the food source? As an immutability, the nature created many rules and is waiting for human being to discovery. Such that Newton found the universal gravitation through the apple falling, predictive analysts also observed the natural activities to apply for their researches. The movement of the flocks of birds inspired the researchers create the data clustering algorithms which are the basic rules for grouping and predicting the behaviors of the targets. Especially, this algorithm is used to analyze the users on the online social communities or micro-blog websites.

What is the purpose of  Birds Flocking analysis?

Analyzing the Birds Flocking allow you cluster the group with similar elements to research more effective and accuracy. Supposing, you have data of A, an active user on Facebook with more than one thousand of friend connection. Through the algorithm, you can realize  who are top 10 friends with having the same  interests and A communicated most frequently.  And A bought a book, named Predictive Analytics For Dummies. Through this information, you can easily target who are your potential customer  for that book. It’s better to introduce the book to 10 closed friends of A rather than to all 1000 A’s friends.

How does it work?

Imagine that users on the online networks are birds. Each users corresponds to each bird in the flock. This activity aims to cluster the groups having the similar elements and flocking behaviors. Through observing, there are 3 main rules while birds are moving:

  • Separation to keep one bird away collision from the other nearest bird
  • Alignment to help one bird move the same direction and velocity with the flock of birds
  • Cohesion with other birds in the flock

They created a virtual space by a paper with random dots, which represent birds’ positions. Each bird has specified speed and position which depend on 3 variances: separation, alignment, and attraction. This movement creates the groups with birds behaviors naturally.  Supposing, you have data of 20 users on Facebook in 10 days. you can cluster group and their behaviors.

For instance, both B and C appeared in the same album because they participated the same event in last week, or they “like” in the same status on the Facebook. The positions of B and C moved closer together – following the attraction rule, and moved with the same speed – following the alignment rule. Applying flocking behavior in 20 days, you will find the clustered groups  formed naturally.

Below is the graph illustrated the similar elements of users on Facebook. The positions of birds reflect the users’ interactions on the online network.

9781118728963-fg0603.tif

Figure 6-3: Applying flocking behavior to detect social communities based on weekly interactions.

Source: Dr. Anasse Bari, Predictive Analytics For Dummies, 2nd Edition

———————————————————————–

Tại sao bồ câu có thể bay theo đàn như một đoàn diễu hành? Tại sao đàn kiến lại có thể tìm đường nhanh nhất đến chỗ có thức ăn ? Như một sự bất di bất dịch, thiên nhiên đã tạo sẵn cho chúng ta những những định luật và quy tắc và chờ con người khám phá. Như Newton với quả táo rơi và lực hút của trái đất, các nhà phân tích dự báo cũng đã lấy cảm hứng từ việc quan sát tự nhiên áp dụng vào các nghiên cứu của mình. Việc quan sát sự di chuyển của đàn chim là khởi nguồn của một trong những thuật toán phân nhóm dữ liệu (data clustering) mà dựa vào đó mà những nhà phân tích có thể phân nhóm các đối tượng nghiên cứu và dự đoán hành vi của họ. Đặt biệt, kỹ thuật này đã được nghiên cứu và sử dụng rất nhiều  để phân tích người tham gia trên các trang mạng xã hội hay micro blog website.

Mục tiêu của Birds Flocking là gì?

Việc phân tích Bird Flocking cho phép bạn nhóm đối tượng với cùng những điểm chung để tiếp cận đối tượng nghiên cứu chính xác và hiệu quả hơn. Ví dụ, bạn thu thập dữ liệu của A, người hoạt động rất tích cực trên mạng xã hội Facebook với hơn 1000 bạn bè kết nối. Thông qua thuật toán, bạn cũng biết 10 người bạn thân nhất, có cùng chung nhiều điểm quan  tâm mà A thường xuyên giao tiếp nhất. A cũng vừa mới mua 1 quyển sách với tựa đề Predictive Analytics For Dummies. Qua những nguồn thông tin trên, bạn có thể tiếp cận với nhóm bạn thân với cùng sở thích này để giới thiệu cuốn sách sẽ hiệu quả hơn nếu giới thiệu với tất cả 1000 bạn trong danh sách.

Ngoài ra, việc phát hiện các nhóm xã hội trực tuyến có thể cực kì có giá trị  cho các cơ quan tình báo (Intelligence Agencies), đặc biệt là khi A và một số người bạn thân thiết – nhưng không bao gồm tất cả các bạn bè của anh ấy -tham gia vào các hoạt động đáng ngờ (suspicious activities).

Birds Flocking hoạt động như thế nào?

Hãy tưởng tượng những người dùng trên các trang mạng xã hội là những con chim. Mỗi cá thể người dùng tương ứng với một con chim trong bầy. Hoạt động này nhằm tìm ra các nhóm có cùng điểm chung và các hành vi bầy đàn. Qua việc quan sát, người ta nhận ra rằng đàn chim bay theo 3 quy tắc chính:

  • Sự cách biệt (separation) giữ con chim không va chạm với con gần nhất
  • Sự sắp xếp (alignment) giúp con chim di chuyển cùng hướng và cùng tốc độ với  đàn
  • Sự gắn kết (cohesion) với các con chim khác trong cùng đàn

Người ta tạo một không gian ảo bằng cách đánh dấu trên giấy vị trí ngẫu nhiên của từng con chim trong đàn. Mỗi con chim có một tốc độ và vị trí cụ thể và phụ thuộc vào 3 biến: sự cách  biệt, sự sắp xếp và sự thu hút. Việc di chuyển này sẽ tạo ra các nhóm với các hành vi bầy đàn tự nhiên. Giả sử bạn có thông tin về 20 người dùng mạng xã hội trong vòng 10 ngày. Dựa vào thuật toán, chúng ta sẽ tìm được nhóm người dùng có sở thích giống nhau và theo dõi hành vi của nhóm đó.

Chẳng hạn, B và C cùng xuất hiện trong một album ảnh do họ đã tham gia cùng một sự kiện hồi tuần trước, hoặc họ cùng  “like” một status trên Facebook. Các vị trí ngẫu nhiên của B và C đã được đánh dấu trên giấy sẽ di chuyển lại gần nhau theo quy tắc “sự thu hút”theo cùng một tốc độ (quy tắc sự sắp xếp). Áp dụng flocking behavior trong hơn 20 ngày sẽ dẫn đế hình thành một cách tự nhiên các nhóm chấm mà có cùng đặc điểm chung theo 1 cách nào đó.

Đây là dữ liệu giao tiếp được phân tích hằng tuần để tìm sự tương đồng của người dùng mạng xã hội. Mỗi tuần các con chim được hình tượng hóa trong một lưới đơn giản. Các vi trí của các con chim thể hiện các giao tiếp của các cá nhân thật.

9781118728963-fg0603.tif

Figure 6-3: Applying flocking behavior to detect social communities based on weekly interactions.

Có rất nhiều cách để áp dụng bird-flocking behaviour để khám phá các nhóm cluster trong  các bộ dữ liệu lớn. Một trong những biển thể gần đây nhất là thuật toán Leader machine-learning cluster để tìm ra  các con chim đầu đàn trong các bầy chim. Thuật toán dự đoán các yếu tố dữ liệu mà có thể dẫn đến một nhóm các đối tượng dữ liệu khác.

Nguồn: Dr. Anasse Bari, Predictive Analytics For Dummies, 2nd Edition

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s