Trong 3 năm (từ 2009 đến 2011) nhóm nghiên cứu của CCIHP đã tìm và lưu trữ các bài báo mạng liên quan LGBT được đăng mỗi ngày, đồng thời tìm lại các bài được đăng từ những năm trước đó. Sự tìm kiếm được thực hiện trên các trang báo mạng phổ biến như VnExpress, Vietnamnet, Tuổi trẻ, Thanh niên, Pháp luật với các từ khóa là các từ chỉ nhân dạng của người LGBT được sử dụng phổ biến trong xã hội. Các từ khoá bao gồm: đồng tính, đồng tính luyến ái, chuyển giới, bóng, bóng lộ, “bóng kín”, ô môi, Les, lesbian, gay, gay kín, pê đê, đồng cô v.v. Các bài báo được lưu trong một văn bản theo thời gian, kèm theo một danh mục liệt kê tác giả, tên và địa chỉ trang web, đường link, và thời gian xuất hiện trên trang báo mạng.
các bài báo về LGBT xuất hiện trong khoảng thời gian sưu tầm (2009 – 2011) và thời gian trước đó mà còn tiếp cận hay lưu lại được, bao gồm cả các bài báo thể hiện thái độ tiêu cực và tích cực. Cách sưu tầm này nhằm mục đích hỗ trợ phân tích về diễn ngôn liên quan tình dục và LGBT trong xã hội Việt Nam, cũng như sự kỳ thị và phân biệt đối xử với những người có thể hiện giới và tình dục khác biệt. Mặt khác, nhóm nghiên cứu cũng muốn cung cấp những góc nhìn đa dạng, những ý kiến trái chiều của dư luận về chủ đề LGBT, và dành phần phân tích và nhận xét cho người đọc. Khi đặt các bài báo theo dòng thời gian, chúng ta có thể quan sát được sự thay đổi trong truyền thông về chủ đề LGBT, và ít nhiều nhận diện được một số những sự kiện lịch sử hay dấu ấn của vận động xã hội và vận động chính sách về quyền của người LGBT đối với truyền thông.