Dữ liệu xã hội là thông tin mà người dùng phương tiện truyền thông xã hội chia sẻ công khai, bao gồm siêu dữ liệu như vị trí của người dùng, ngôn ngữ được nói, dữ liệu tiểu sử và / hoặc liên kết được chia sẻ. Dữ liệu xã hội có giá trị đối với các nhà tiếp thị đang tìm kiếm những hiểu biết của khách hàng có thể làm tăng doanh số hoặc, trong trường hợp chiến dịch chính trị, giành được phiếu bầu. Có nhiều loại dữ liệu xã hội, bao gồm các tweet từ Twitter, bài đăng trên Facebook, ghim trên, bài đăng trên Tumblr và đăng ký trên Foursquare và Yelp. Quảng cáo Facebook dành cho doanh nghiệp và Twitter là hai chương trình giúp nhà quảng cáo sử dụng dữ liệu xã hội để tiếp thị cho người dùng được nhắm mục tiêu có khả năng quan tâm đến quảng cáo của họ.
Phá vỡ dữ liệu xã hội
Người dùng tự nguyện công khai nhiều dữ liệu xã hội của họ, cho phép các công ty truy cập miễn phí và dễ dàng vào nó. Nếu một công ty bán vé cho các sự kiện thể thao thấy rằng người dùng theo dõi một số đội thể thao, công ty đó có thể nhắm mục tiêu quảng cáo đến người dùng đó để cố gắng lôi kéo cô ấy mua vé để xem đội bóng yêu thích của mình chơi. Một cách khác mà một công ty có thể sử dụng dữ liệu xã hội là cung cấp quảng cáo kịp thời dựa trên các bài đăng gần đây, chẳng hạn như quảng cáo thiết bị cho một người đã chia sẻ rằng họ đang mua nhà.
Với dữ liệu xã hội chất lượng cao được tổng hợp và phân tích chính xác, các công ty có thể nhắm mục tiêu quảng cáo đến những người có nhiều khả năng mua sản phẩm hoặc dịch vụ của họ. Dữ liệu xã hội cũng có thể giúp các công ty xác định những nơi hiệu quả nhất để quảng cáo. Các công ty có thể tinh chỉnh quảng cáo của họ hơn nữa bằng cách thu hẹp đối tượng mục tiêu của họ theo giới tính, ngôn ngữ, thiết bị điện tử được sử dụng, độ tuổi, sở thích, vị trí và các yếu tố khác. Dữ liệu xã hội không chỉ giúp các công ty có được khách hàng mới mà còn giúp họ gắn kết hơn nữa với các khách hàng hiện tại.
Phân tích dữ liệu xã hội
Thông thường có hai bước để phân tích dữ liệu xã hội. Đầu tiên là thu thập dữ liệu do người dùng tạo trên các trang mạng và sau đó để phân tích dữ liệu đó. Quá trình phân tích thường diễn ra trong thời gian thực - và sau đó được sử dụng để xác định ảnh hưởng, tầm với, mức độ liên quan và các cân nhắc khác. Các doanh nghiệp sử dụng loại phân tích dữ liệu này phải ghi nhớ một số điều, bao gồm cách phân biệt giữa dữ liệu xã hội và tình cảm, mức độ phù hợp (những gì liên quan hôm nay có thể không phải là ngày mai), chất lượng (những thông điệp và nhận xét nhất định có ảnh hưởng như thế nào) và cách thức hoạt động của virus bắt đầu và lây lan.
Hạn chế của dữ liệu xã hội
Dữ liệu xã hội là không hoàn hảo vì nhiều lý do. Nó được giới hạn trong thông tin mà người dùng quyết định chia sẻ về bản thân họ. Ví dụ: một số người dùng không thể chia sẻ vị trí hoặc giới tính của họ, cung cấp cho nhà quảng cáo một hồ sơ không đầy đủ để làm việc. Một vấn đề khác là nhiều người dùng trên phương tiện truyền thông xã hội không phải là người dùng thật mà là tài khoản robot, hoặc bot giả. Ngay cả với người dùng thực, việc cố gắng đánh giá cảm xúc của họ về một ứng cử viên chính trị hoặc thương hiệu (được gọi là phân tích tình cảm, dựa trên những nhận xét họ đưa ra không phải lúc nào cũng có thể vì nhiều ý kiến của họ là trung lập và thuật toán có thể phân loại nhận xét không chính xác là tích cực khi họ là tiêu cực và ngược lại. Hơn nữa, nhiều ý kiến tích cực và tiêu cực có sẵn là cực đoan, gây khó khăn cho việc đánh giá chính xác cảm nhận của người tiêu dùng về sản phẩm, dịch vụ, thương hiệu hoặc ứng cử viên chính trị.
