这是一个创建于 90 天前的主题,其中的信息可能已经有所发展或是发生改变。
- 合作目(系共有部分): ●圈客行部分: (1) 台地(第一段)之「商」取「台地」及「外」之目客,之行。 (2) 大地(第二段加入之目)之「外商」取「外」之目客,之行。 ●口碑行部分: (1) 台地(第一段)之「商」出合意及有效之容,提供消者 GoogleMap 、FB 、IG 、小、TikTok 等五平台出。 (2) 大地(第二段加入之目)之「商」出合意及有效之容,提供消者小、TikTok 等平台出。
- 估:第一段估年人民 5000 以上,第二段保守估年人民 2 元以上。
- 合作酬(以承揽及前提): (1) 每月利分配:月利之 20%。 (2) 用:完成前 50 行用 2 元人民(廓、重、注意部分,大致已清楚)。 (3) 前後端系 ONCALL 及程式增修用:每月用人民 1 元。(期每月新增 3 行)
- 有能力及意向之夥伴或,留言。WeChat ID:wwa777778
- (能力需求)按前端(B 端)及 AI 需求爬取及整 FB 、IG 、GOOGLEMAP 、官、amazon.....之容: ●核心技能: (1) Python 或其他爬相程式言,至少 2 年以上爬。 (2) 、重既有爬程式。 (3) 理解 HTTP Request / Response 制,能理登入、Headers 、Cookies 、反爬制等。 (4) 依有流程主行程式,立分析充,考已程式行化功能展。 (5) Web Scraping 框架工具,如 Scrapy 、BeautifulSoup 、Selenium 或 Puppeteer ,根需求合工具。 (6) 基於有程式行、整功能迭代,保系定性持改。 (7) 示警制、平台。 (8) FB/IG 自化建、能力。 (9) VPN 上技及本系反爬能力。 (10) 具全端程式及能力。 ●社交媒爬: (11) 爬取 Instagram 、Facebook 等社交平台文、短影音( Reels 、Stories 等)及相(如留言、按、分享)。
(12) 熟悉各大社交媒平台限制避技巧,保料抓取的定性合法性。 (13) 理( Javascript 渲染)反爬制(如 CAPTCHA 、IP 封)的挑。 (14) 以 GraphQL 取料。 ●WhatsApp: (15) 爬取 amazon 消者相料。 (16) 以 WhatsApp 送息至 messenger 。 ●以 FB 及 IG 取除 FB 及 IG 容外之「特定受群之及特性」。 - (能力需求)自然言理( NLP )言,包括: ●意分析、向量( word embeddings )、境理解、法( Syntax )、( Semantics )、用( Pragmatics )。 ●有效用、上下文、格式化入影 AI 出。
- (能力需求)AI 及大型言模型( LLM )知,包括: ●Transformer 、GPT 、BERT 等 LLM 的基本原理工作方式。 ●模型的限制(如幻、偏、不完整)以之 prompt 避免。 ●以 Zero-shot 、Few-shot Learning 等 prompt 技巧,提升 LLM 回的性。 ●Prompt 化技巧: (1) 精性( Precision ):以、明的言表需求。 (2) 上下文( Context Design ):提供量,保 AI 理解目。 (3) 束格式化( Constraints & Formatting ):要求特定出格式,如 JSON 、Markdown 、表格。 (4) ( A/B Testing ):不同 prompt ,找出最佳效果。 ●程式 API 整合: (1) Python 及各大公司 API / LangChain 等框架。 (2) 撰本(.sh )自化 prompt 分析 AI 出果。 (3) 使用正表式、文本理技巧提取 AI 生的容。
●料分析估: (1) 分析 AI 回的度、一致性、造性,找出最佳 prompt 模式。 (2) AB 比不同 prompt 的效果。 ●域知( Domain Knowledge ): (1) 不同用景(如程式生成、、法律、行、不同)整 Prompt 。 (2) 具 UX / UI 思,保 AI 出使用者有值。 ●版本控制作: (1) 有案合作,看得懂其他人案的程式。 (2) Git / GitHub 。 (3) HACKMD:技文件撰、度 ( Prompt 、流程) 、原最佳。 ●安全道德考量: (1) 保 Prompt 避免生有害容(如偏、假)。 (2) 解 AI 法道德,如歧、私保、容查。 - (能力需求)料系、化、管理 (1) 式料(如 MySQL 、PostgreSQL )的用,料索引,大模料存查的化。 (2) 熟悉 Linux 境,部署排程( cron 、systemd 、Docker ,具 Kubernetes (k8s))。 (3) 高效的料索引,支援跨行、多的社交媒料存快速索。 (4) 料清理正化,保爬取料的一致性可用性。 (5) 管理管理料。
- (能力需求)性技能其他要求 ●程式品文件:熟悉版本控制工具(如 Git ),撰乾、可的程式,保持的文件,保程式易於理解。 ●料私合性:深入了解料私法律(如 GDPR 、平台使用款),保爬行符合法要求,能在爬系考理法律束。 ●按既定程序架行:理解既定程序架需求,能密切合作,具良好的成能力。 ●理解需求其化技。 ●持技更新:新技社交平台 API 更新的保持敏感,持以快速化的爬境。 ●快速理解既有程式行、功能整、修及效能化。 ●Microsoft Azure 端服,在 Azure 境中部署展爬系,相工具(如 Azure Functions 、Azure Blob Storage )。 ●容器化技(如 Docker ),以支援爬系的部署管理。 ●料分析能力,爬取料行初步化理,方便後分析用。 ●版本控制控:Git / GitHub 程式版本管理&控日管理(如 Sentry 、ELK ,或可自控本)。
- (能力需求)意思解能力&持研究: ●社交平台反爬制的化或料效能瓶。 ●能拆解,化 AI 可理解的入格式。 ●透迭代找到最有效的 Prompt 合。 ●思考如何 AI 生成更具意、符合需求的容。 ●跟 AI / NLP 最新技(如 OpenAI 布的新模型、文、第一手知道 Deepseek 消息等等)。 ●持化 Prompt ,以 AI 的步用需求。 ●查文研究解,秀的解能力。