AI ประเมินผลเว็บไซต์โดยเลียนแบบผู้คนจริง ๆ เป็นอย่างไรบ้าง?

วันนี้หนึ่งในองค์ประกอบของ uKit AI ซึ่งเป็นระบบการออกแบบเว็บไซต์อัจฉริยะกำลังเป็นที่เปิดเผยต่อสาธารณชน เป็นโมดูลต้นแบบสำหรับประเมินความงามของหน้าเว็บ มันรวมเครือข่ายประสาทและต้นไม้ตัดสินใจเพื่อเลียนแบบปฏิกิริยาของผู้เข้าชมสามัญกับการออกแบบของเว็บไซต์ athe

ในอนาคตโมดูลดังกล่าวจะประเมินการทำงานของอัลกอริทึมการออกแบบเชิงกำเนิดซึ่งเป็นองค์ประกอบสำคัญของ uKit AI ซึ่งจะออกแบบหน้าเว็บโดยไม่มีการมีส่วนร่วมของมนุษย์อาศัยเนื้อหาที่มีอยู่และ "ความรู้" ของความแตกต่างระหว่างเว็บไซต์ที่ไม่มีประสิทธิภาพและ สิ่งหนึ่งที่มุ่งเพิ่มอัตราการแปลง

เวอร์ชัน WebScore AI ปัจจุบันสะท้อนมุมมองของผู้ใช้อินเทอร์เน็ตโดยเฉลี่ยเกี่ยวกับลักษณะที่ปรากฏของเว็บไซต์ แม้ว่าเราสามารถสร้างตัวเลือกอื่น ๆ เช่นเป็นไปได้ที่จะให้คะแนนการใช้งานเว็บไซต์

เว็บไซต์ที่ใช้สำหรับฝึกอบรมระบบ ก่อนอื่นเราได้รวบรวมเว็บไซต์ 12,000 แห่งและร้านค้าออนไลน์ที่สร้างขึ้นในปีที่แตกต่างกันในแพลตฟอร์มต่างๆและในภาษาต่างๆ ภารกิจหลักคือการได้รับตัวอย่างการไล่ระดับสีที่มองเห็นได้อย่างเพียงพอตั้งแต่เว็บไซต์ที่ไม่ดีไปจนถึงเว็บไซต์ที่ดีมาก ด้วยวิธีนี้เราได้แสดงระบบที่สามารถเกิดขึ้นได้ในเว็บที่ทันสมัย

ตัวอย่างเว็บไซต์จากตัวอย่างการฝึกอบรม

การไล่ระดับแต่ละครั้งจะถูกวัดด้วยสเกลและระดับนี้ควรจะเข้าใจได้โดยบุคคลทั่วไปที่มีความคิดเห็นที่เราพยายามทำแบบจำลอง ดังนั้นเราจึงได้แนวคิดเกี่ยวกับ ‘ตั้งแต่ 1 ถึง 10’ ซึ่งใช้ในบริการของเรา

ผู้ที่เลียนแบบโดย WebScore AI เราต้องการสองสิ่งในการสร้างชุดข้อมูล (ชุดข้อมูลสำหรับรูปแบบการฝึกอบรม) จากเว็บไซต์ต่างๆ:

  • สัญญาณที่ระบบจะพิจารณาว่าเป็นเว็บไซต์ที่น่าสนใจหรือไม่
  • การประเมิน (ทำเครื่องหมาย) ด้วยความช่วยเหลือของสเกลของเราสำหรับเว็บไซต์จำนวนหนึ่ง พวกเขาจะกลายเป็นแบบจำลองสำหรับระบบ

ใครบางคนควรใส่การประเมินเบื้องต้นเหล่านี้ “ ครู” เช่นนี้หรือกลุ่มของ“ ครู” ที่เฉพาะเจาะจงมากขึ้นจะส่งผลกระทบอย่างมากต่อรูปแบบการทำงานของมัน

ส่วนต่อประสานการประเมินเว็บไซต์: รับและใช้งานจาก GitHub ของเราในไม่ช้า

ในการรวบรวมกลุ่มโฟกัสเราได้ทำการคัดเลือกผู้สมัครเบื้องต้นในตัวอย่างเว็บไซต์ 1,500 แห่ง งานประจำ แต่เป็นงานที่มีความรับผิดชอบ การคัดเลือกเบื้องต้นช่วยให้เราสามารถกำจัดผู้สมัครที่ไม่เหมาะสมและยังยกเว้นเว็บไซต์“ แย้ง” (เมื่อมีคนให้คะแนนว่าเป็น 1 และอีก 1 เว็บไซต์เป็น 10) จากตัวอย่าง

ตอนแรกเราทดลองวิธีการประเมินผล

ตัวอย่างเช่นเราเสนอให้ประเมินเว็บไซต์หนึ่งครั้งจากนั้นสองเว็บไซต์ในเวลาเดียวกันหรือเลือกหนึ่งในสองเว็บไซต์ที่น่าสนใจที่สุด วิธีการที่ผู้ตอบเห็นเว็บไซต์เดียวและประเมินว่ามันทำงานได้ดีที่สุด เราใช้มันเพื่อประเมิน 10,000 เว็บไซต์ที่เหลืออยู่

คนประเมินว่าเว็บไซต์มีความสวยงามหรือไม่ เครื่องจะทำเช่นนี้ได้อย่างไร คุณและฉันต้องการเพียงหนึ่งรูปแบบในการแสดงความคิดเห็นต่อความสวยงามโดยรวมของบางสิ่ง แต่เรารู้ว่าปีศาจอยู่ในรายละเอียด

สัญญาณความน่าดึงดูดของเว็บไซต์ซึ่งจะเป็นแนวทางในการสร้างโมเดลเป็นช่วงเวลาสำคัญสำหรับโครงการทั้งหมด เราขอให้ทีมออกแบบสร้างเว็บไซต์ uKit ใช้มือทำงานของพวกเขาเป็นพื้นฐานสำหรับเว็บไซต์หลายแสนแห่งและผู้คนนับล้านมองเห็น เราได้รวบรวมรายการคุณสมบัติที่ผู้เชี่ยวชาญให้ความสนใจเมื่อพัฒนาการออกแบบเว็บไซต์ จากนั้นพยายามตัดมันทิ้งเฉพาะสิ่งที่สำคัญที่สุด

ทีมออกแบบ uKit.com

ด้วยเหตุนี้เราจึงมีรายการตรวจสอบ 125 เกณฑ์ที่แตกต่างกัน แต่มีความสำคัญซึ่งแบ่งออกเป็นสิบห้าหมวดหมู่ ตัวอย่างเช่นรายการมี: การปรับให้เข้ากับหน้าจอยอดนิยมความหลากหลายของขนาดตัวอักษรความบริสุทธิ์ของสีความยาวของส่วนหัวสัดส่วนของภาพในหน้าทั้งหน้าและอื่น ๆ สิ่งที่ต้องทำคือฝึกรูปแบบโดยใช้กฎเหล่านี้

สร้างอัลกอริทึม 'รูปแบบการสอน' คืออะไรกันแน่ เป็นการสร้างอัลกอริทึมที่อิงตามลักษณะเฉพาะที่กำหนดและสามารถประเมินเว็บไซต์ที่เลือกได้ เป็นที่พึงปรารถนาที่การประเมินผลของระบบและการประเมินผลโดยเฉลี่ยของครูจะแบ่งปันช่องว่างขั้นต่ำในการประเมินขั้นสุดท้าย

เราได้ตัดสินใจใช้วิธีเพิ่มระดับความลาดชันเหนือต้นไม้ตัดสินใจเพราะเป็นวิธีที่ได้รับความนิยมและมีประสิทธิภาพมากที่สุดวิธีหนึ่ง ใช้อัลกอริธึมพื้นฐานสร้างชุดผลลัพธ์โดยรวมซึ่งเกินกว่าผลลัพธ์ของอัลกอริทึมแยกต่างหาก

ยิ่งไปกว่านั้นการเพิ่มอัลกอริธึมพื้นฐานแต่ละอันในภายหลังจะพยายามปรับปรุงคุณภาพของคำตอบของทั้งชุด

เพื่อเร่งและลดความยุ่งยากในกระบวนการเราใช้ห้องสมุด CatBoost จาก Yandex ซึ่งอนุญาตให้สร้างบูสเตอร์แบบไล่ระดับสีในสิ่งที่เรียกว่า "ต้นไม้การตัดสินใจที่ลืมเลือน" เพื่อสร้างความมั่นใจในความสามารถในการฝึกอบรมที่ดีของแบบจำลองตั้งแต่เริ่มต้น ) สำหรับวัตถุใหม่

การเพิ่มโครงข่ายประสาทเทียม เมื่ออัลกอริทึมพื้นฐานพร้อมเราตัดสินใจทำการทดลอง: ผลลัพธ์จะดีขึ้นหรือไม่หากเราเพิ่มเครือข่ายประสาทเทียม ที่จริงแล้วเรารู้วิธี 'ดู' เว็บไซต์และการออกแบบแล้วและตอนนี้เราตัดสินใจที่จะให้ 'แว่นขยาย' กับระบบซึ่งมันสามารถใช้เพื่อเปิดเผยรายละเอียดได้มากขึ้น

เราเลือกหนึ่งในเครือข่ายที่นิยมมากที่สุดคือ resnet50 ซึ่งเป็นที่รู้จักกันดีว่าเป็นอัลกอริทึมที่ดีสำหรับการแยกฟีเจอร์ระดับสูงออกมา และเราได้เรียนรู้วิธีรับคุณลักษณะเพิ่มเติม 1,000 รายการสำหรับการประเมินเว็บไซต์ ด้วยเหตุนี้ระบบจึงแสดงลักษณะของ URL โดยรวมคุณสมบัติทั้งหมด 1125 รายการและค้นหา "สถานที่" ของเว็บไซต์ในระดับ 10 จุด กระบวนการนี้ใช้เวลาหลายสิบวินาทีนั่นคือเหตุผลที่เราพิจารณาเร่งความเร็วของแบบจำลองโดยการลดจำนวนสัญญาณในขณะที่รักษาคุณภาพของการประเมินในระดับเดียวกัน

ผลลัพธ์ครั้งแรก แบบจำลองที่ได้รับการฝึกฝนด้วยวิธีนี้จะทำให้การประมาณการมีความแม่นยำมากขึ้น 3 เท่าเมื่อเทียบกับแบบจำลอง 'ครู' รายบุคคล

เราสามารถพูดได้ว่าแบบจำลองนี้มีความเหนือกว่าครูคนแรกเนื่องจากการประมาณกลุ่มสนทนาแตกต่างจากค่าเฉลี่ยอย่างมากมากกว่าการประเมินโครงข่ายประสาท ตอนนี้เรานำอัลกอริทึมเข้าสู่เครือข่ายเพื่อการฝึกอบรมเพิ่มเติม และคุณก็สามารถเป็นครูได้เช่นกัน