Nghiên cứu điển hình: Khám phá YouTube chính xác—Tìm kiếm những người sáng tạo "Macro" nhất quán
By khoanc, at: 19:00 Ngày 23 tháng 2 năm 2026
Thời gian đọc ước tính: __READING_TIME__ phút
YouTube là "trò chơi dài hạn" của mạng xã hội. Trong khi các nền tảng khác phát triển mạnh mẽ nhờ những khoảnh khắc thoáng qua, YouTube lại khen thưởng cho những sản phẩm đầu ra bền vững và có thể dự đoán được.
Nghiên cứu điển hình này khám phá một quy trình tự động hóa mạnh mẽ mà chúng tôi đã phát triển để xác định các kênh YouTube đã đạt được trạng thái "Macro" và duy trì lịch đăng tải thường xuyên.
Nhiệm vụ của chúng tôi: Xác định các kênh có 200.000+ người đăng ký tuân theo một lịch đăng bài hàng tuần.
Thách thức: Phân tích tính nhất quán trong một biển nội dung
Việc xác định các kênh lớn rất đơn giản, nhưng việc xác minh "tính nhất quán" lại phức tạp về mặt kỹ thuật. Dữ liệu của YouTube thường trình bày ngày tháng theo định dạng tương đối (ví dụ: "3 tuần trước"), rất khó để phân tích theo chương trình. Để giải quyết vấn đề này, Glinteco đã xây dựng một công cụ logic chuyển đổi thời gian tương đối thành dữ liệu tuyến tính để phát hiện các khoảng trống trong lịch sử tải lên của người sáng tạo.
Giải pháp: Quy trình xác minh hai bước
Chúng tôi đã sử dụng kết hợp streamers/youtube-scraper và streamers/youtube-channel-scraper để tạo một phễu được lọc. Điều này đảm bảo rằng chúng tôi chỉ sử dụng tài nguyên để thu thập thông tin chuyên sâu về các kênh đã vượt qua yêu cầu về kích thước ban đầu.
Bước 1: Tìm kiếm rộng và lọc theo kích thước
Đầu tiên, chúng tôi tìm kiếm trên các ngách cụ thể. Chúng tôi lấy siêu dữ liệu kênh cơ bản và áp dụng một hàm phân tích cú pháp để chuẩn hóa số lượng người đăng ký (chuyển đổi "200K" hoặc "1.5M" thành số nguyên thuần túy).
# Logic của Glinteco: Chuẩn hóa Chuỗi người đăng ký
def parse_subscribers(sub_value):
sub_str = str(sub_value).upper().replace(",", "").strip()
if "M" in sub_str:
return int(float(sub_str.replace("M", "")) * 1_000_000)
elif "K" in sub_str:
return int(float(sub_str.replace("K", "")) * 1_000)
return int(sub_str)
Bước 2: Phân tích theo thời gian để có sự nhất quán hàng tuần
Khi có danh sách rút gọn các kênh có hơn 200 nghìn người đăng ký, chúng tôi sẽ xem xét kỹ lịch sử video và "Shorts" của họ. Tập lệnh chuyển đổi ngày tải lên thành Số tuần ISO. Một kênh chỉ "đủ tiêu chuẩn" nếu khoảng cách giữa các tuần hoạt động là tối thiểu (được xác định bằng WEEKLY_TOLERANCE_GAP của chúng tôi).
# Logic của Glinteco: Phát hiện khoảng trống trong việc đăng bài hàng tuần
def is_weekly_poster(videos):
active_weeks = set()
for vid in videos:
dt = parse_relative_date(vid.get("date"))
if dt:
year, week, _ = dt.isocalendar()
active_weeks.add((year, week))
# Sắp xếp và kiểm tra các khoảng trống tuyến tính
sorted_weeks = sorted(list(active_weeks), reverse=True)
# Nếu khoảng cách giữa tuần X và tuần Y > 1, chuỗi sẽ bị phá vỡ
return check_gaps(sorted_weeks)
Kết quả: Thông tin chi tiết về người sáng tạo giá trị cao
Bằng cách tự động hóa việc phân tích ngày và phân tích khoảng trống tuyến tính tại Glinteco, chúng tôi đã chuyển đổi quy trình kiểm tra thủ công kéo dài một tuần thành một lần chạy tự động trong 10 phút.
Tại sao sự nhất quán hàng tuần lại quan trọng
Đối với các thương hiệu, người đăng bài hàng tuần đại diện cho một "nhịp đập nội dung" đáng tin cậy. Những người sáng tạo này có lượng khán giả cao điểm có thể dự đoán được, khiến họ trở thành đối tác lý tưởng cho việc ra mắt sản phẩm theo thời gian hoặc các tích hợp được tài trợ. Tập lệnh của chúng tôi đảm bảo rằng ngân sách tiếp thị của khách hàng không bao giờ bị chi tiêu cho các kênh "mờ dần" đã ngừng sản xuất thường xuyên.