Skip to content

Bug: Cannot fetch content from Facebook posts #697

@mrgoonie

Description

@mrgoonie

🐛 Bug Description

GoClaw không thể fetch nội dung từ Facebook posts. Khi người dùng gửi link Facebook bot, hệ thống không trích xuất được content từ các URL dạng:

  • https://www.facebook.com/share/p/{post_id}/
  • https://www.facebook.com/{username}/posts/{post_id}/

🔍 Expected Behavior

Bot có thể:

  • Fetch và trích xuất nội dung text từ Facebook posts
  • Xử lý các loại URL Facebook khác nhau (share links, direct post links)
  • Handle authentication/paywall cases gracefully (nếu có)

📝 Example

URL test: https://www.facebook.com/share/p/1CNZhmWeQh/?mibextid=wwXIfr

Kết quả hiện tại: Không fetch được content

🎯 Possible Solutions

  1. Web scraper/Fetcher enhancement — Cập nhật logic fetch để handle Facebook HTML structure
  2. Facebook Graph API — Tích hợp official API (cần access token)
  3. Third-party scraper — Dùng service như Apify, ScrapingBee (nếu cần)
  4. Graceful fallback — Nếu không fetch được, inform user và skip content extraction

📋 Technical Notes

  • Facebook có anti-scraping mechanisms (login wall, rate limiting)
  • Cần test với cả public posts và posts yêu cầu login
  • Consider using web_fetch tool với appropriate extractMode

🔗 Related

  • Feature: Link preview/content extraction in GoClaw
  • Affects: User experience when sharing Facebook content

Reported by: @voquoccuong
Priority: MEDIUM (UX enhancement)

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't workingenhancementNew feature or request

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions