Отфильтровать список email на корректность

Discussion in 'Python' started by rcoin, 26 Dec 2021.

  1. rcoin

    rcoin New Member

    Joined:
    26 Dec 2021
    Messages:
    2
    Likes Received:
    0
    Reputations:
    0
    Вводится список email-адресов в одну строчку через пробел.
    Среди них нужно оставить только корректно записанные адреса.
    Будем полагать, что к таким относятся те, что используют латинские буквы, цифры и символ подчеркивания.
    А также в адресе должен быть символ "@", а после него символ точки "."
    (между ними, конечно же, могут быть и другие символы).

    Результат отобразить в виде строки email-адресов, записанных через пробел.
    Code:
    Sample Input:
    
    abc@it.ru dfd3.ru@mail biba123@list.ru sc_lib@list.ru $fg9@fd.com
    Sample Output:
    
    abc@it.ru biba123@list.ru sc_lib@list.ru
    Code:
    from string import ascii_letters as al, digits as ds
     
    symbols = al + ds + '_'
     
    print(*filter(lambda x: '@.' < x > symbols, input().split()))
    
    Code:
    # мой вывод почему то пропускает 1 емаил неправильный
    
    Test input:
    abc@it.ru dfd3.ru@mail biba123@list.ru sc_lib@list.ru $fg9@fd.com
    
    Test output:
    dfd3.ru@mail biba123@list.ru sc_lib@list.ru
     
  2. rcoin

    rcoin New Member

    Joined:
    26 Dec 2021
    Messages:
    2
    Likes Received:
    0
    Reputations:
    0
    Решил
    Code:
    import re
    emails = input().split()
    res = filter(lambda x: re.findall(r'^[\w]+@[\w]+.[\w]', x), emails)
    print(*res)
     
  3. lifescore

    lifescore Elder - Старейшина

    Joined:
    27 Aug 2011
    Messages:
    640
    Likes Received:
    504
    Reputations:
    72
    Code:
    [_a-z0-9-]+(\.[_a-z0-9-]+)*@[a-z0-9-]+(\.[a-z0-9-]+)*(\.[a-z]{2,13})
    корректнее, домены бывают и 3+ уровня. но по хорошему publicsuffix валидацию на то что после "@"
     
    k36 likes this.
  4. b3

    b3 Moderator

    Joined:
    5 Dec 2004
    Messages:
    2,041
    Likes Received:
    933
    Reputations:
    199
    _________________________
  5. lifescore

    lifescore Elder - Старейшина

    Joined:
    27 Aug 2011
    Messages:
    640
    Likes Received:
    504
    Reputations:
    72
    ну тогда уж
    https://fightingforalostcause.net/content/misc/2006/compare-email-regex.php

    isEmail по тесту вышло = 79 / 135
    p.s. не особо заморачивался над эскейпами, мож какие криво экранировались


    Регулярками по линку выше (не тестил, copy-paste со статы)
    Valid: 96/134
    Invalid: 130/132


    PHP:
    <?php
    // https://github.com/dominicsayers/isemail
    require_once 'is_email.php';
    // 79 / 135

    // These should be valid
    $arrayValid = array("first.last@iana.org""1234567890123456789012345678901234567890123456789012345678901234@iana.org""\"\\\"first\\\\\"last\\\"@iana.org\"""\"\\\"first@last\\\"@iana.org\"""\"\\\"first\\last\\\"@iana.org\"""x@x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23 [...]""1234567890123456789012345678901234567890123456789012345678@1234567890123456789012345678901234567890123456 [...]""first.last@[12.34.56.78]""first.last@[IPv6:::12.34.56.78]""first.last@[IPv6:1111:2222:3333::4444:12.34.56.78]""first.last@[IPv6:1111:2222:3333:4444:5555:6666:12.34.56.78]""first.last@[IPv6:::1111:2222:3333:4444:5555:6666]""first.last@[IPv6:1111:2222:3333::4444:5555:6666]""first.last@[IPv6:1111:2222:3333:4444:5555:6666::]""first.last@[IPv6:1111:2222:3333:4444:5555:6666:7777:8888]""first.last@x23456789012345678901234567890123456789012345678901234567890123.iana.org""first.last@3com.com""first.last@123.iana.org""\"\\\"first\\last\\\"@iana.org\"""first.last@[IPv6:1111:2222:3333::4444:5555:12.34.56.78]""first.last@[IPv6:1111:2222:3333::4444:5555:6666:7777]""first.last@example.123""first.last@com""\"\\\"Abc\\@def\\\"@iana.org\"""\"\\\"Fred\\ Bloggs\\\"@iana.org\"""\"\\\"Joe.\\Blow\\\"@iana.org\"""\"\\\"Abc@def\\\"@iana.org\"""\"\\\"Fred Bloggs\\\"@iana.org\"""user+mailbox@iana.org""customer/department=shipping@iana.org""\$A12345@iana.org""!def!xyz%abc@iana.org""_somename@iana.org""dclo@us.ibm.com""peter.piper@iana.org""\"\\\"Doug \\\\\"Ace\\\\\" L.\\\"@iana.org\"""test@iana.org""TEST@iana.org""1234567890@iana.org""test+test@iana.org""test-test@iana.org""t*est@iana.org""+1~1+@iana.org""{_test_}@iana.org""\"\\\"[[ test ]]\\\"@iana.org\"""test.test@iana.org""\"\\\"test.test\\\"@iana.org\"""\"test.\\\"test\\\"@iana.org\"""\"\\\"test@test\\\"@iana.org\"""test@123.123.123.x123""test@123.123.123.123""test@[123.123.123.123]""test@example.iana.org""test@example.example.iana.org""\"\\\"test\\test\\\"@iana.org\"""test@example""\"\\\"test\\blah\\\"@iana.org\"""\"\\\"test\\blah\\\"@iana.org\"""\"\\\"test\\\\\"blah\\\"@iana.org\"""customer/department@iana.org""_Yosemite.Sam@iana.org""~@iana.org""\"\\\"Austin@Powers\\\"@iana.org\"""Ima.Fool@iana.org""\"\\\"Ima.Fool\\\"@iana.org\"""\"\\\"Ima Fool\\\"@iana.org\"""\"\\\"first\\\".\\\"last\\\"@iana.org\"""\"\\\"first\\\".middle.\\\"last\\\"@iana.org\"""\"\\\"first\\\".last@iana.org\"""\"first.\\\"last\\\"@iana.org\"""\"\\\"first\\\".\\\"middle\\\".\\\"last\\\"@iana.org\"""\"\\\"first.middle\\\".\\\"last\\\"@iana.org\"""\"\\\"first.middle.last\\\"@iana.org\"""\"\\\"first..last\\\"@iana.org\"""\"\\\"first\\\\\\\\\"last\\\"@iana.org\"""\"first.\\\"mid\\dle\\\".\\\"last\\\"@iana.org\"""\"\\\"test""     blah\\\"@iana.org\"""(foo)cal(bar)@(baz)iamcal.com(quux)""cal@iamcal(woo).(yay)com""cal(woo(yay)hoopla)@iamcal.com""cal(foo\\@bar)@iamcal.com""cal(foo\\)bar)@iamcal.com""first().last@iana.org""pete(his account)@silly.test(his host)""c@(Chris's host.)public.example""jdoe@machine(comment).  example""1234   @   local(blah)  .machine .example""first(abc.def).last@iana.org""\"first(a\\\"bc.def).last@iana.org\"""\"first.(\\\")middle.last(\\\")@iana.org\"""first(abc\\(def)@iana.org""first.last@x(1234567890123456789012345678901234567890123456789012345678901234567890).com""a(a(b(c)d(e(f))g)h(i)j)@iana.org""name.lastname@domain.com""a@b""a@bar.com""aaa@[123.123.123.123]""a@bar""a-b@bar.com""+@b.c""+@b.com""a@b.co-foo.uk""\"\\\"hello my name is\\\"@stutter.com\"""\"\\\"Test \\\\\"Fail\\\\\" Ing\\\"@iana.org\"""valid@about.museum""shaitan@my-domain.thisisminekthx""foobar@192.168.0.1""\"\\\"Joe\\Blow\\\"@iana.org\"""HM2Kinsists@(that comments are allowed)this.is.ok""user%uucp!path@berkeley.edu""first.last @iana.org""cdburgess+!#\$%&'*-/=?+_{}|~test@gmail.com""first.last@[IPv6:::a2:a3:a4:b1:b2:b3:b4]""first.last@[IPv6:a1:a2:a3:a4:b1:b2:b3::]""first.last@[IPv6:::]""first.last@[IPv6:::b4]""first.last@[IPv6:::b3:b4]""first.last@[IPv6:a1::b4]""first.last@[IPv6:a1::]""first.last@[IPv6:a1:a2::]""first.last@[IPv6:0123:4567:89ab:cdef::]""first.last@[IPv6:0123:4567:89ab:CDEF::]""first.last@[IPv6:::a3:a4:b1:ffff:11.22.33.44]""first.last@[IPv6:::a2:a3:a4:b1:ffff:11.22.33.44]""first.last@[IPv6:a1:a2:a3:a4::11.22.33.44]""first.last@[IPv6:a1:a2:a3:a4:b1::11.22.33.44]""first.last@[IPv6:a1::11.22.33.44]""first.last@[IPv6:a1:a2::11.22.33.44]""first.last@[IPv6:0123:4567:89ab:cdef::11.22.33.44]""first.last@[IPv6:0123:4567:89ab:CDEF::11.22.33.44]""first.last@[IPv6:a1::b2:11.22.33.44]""test@test.com""test@xn--example.com""test@example.com");

    // These should be invalid
    $arrayInValid = array("first.last@sub.do,com""first\\@last@iana.org""123456789012345678901234567890123456789012345678901234567890@12345678901234567890123456789012345678901234 [...]""first.last""12345678901234567890123456789012345678901234567890123456789012345@iana.org"".first.last@iana.org""first.last.@iana.org""first..last@iana.org""\"\\\"first\\\"last\\\"@iana.org\"""\"\\\"\\\"\\\"@iana.org\"""\"\\\"\\\\\"@iana.org\"""\"\\\"\\\"@iana.org\"""first\\@last@iana.org""first.last@""x@x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23456789.x23 [...]""first.last@[.12.34.56.78]""first.last@[12.34.56.789]""first.last@[::12.34.56.78]""first.last@[IPv5:::12.34.56.78]""first.last@[IPv6:1111:2222:3333:4444:5555:12.34.56.78]""first.last@[IPv6:1111:2222:3333:4444:5555:6666:7777:12.34.56.78]""first.last@[IPv6:1111:2222:3333:4444:5555:6666:7777]""first.last@[IPv6:1111:2222:3333:4444:5555:6666:7777:8888:9999]""first.last@[IPv6:1111:2222::3333::4444:5555:6666]""first.last@[IPv6:1111:2222:333x::4444:5555]""first.last@[IPv6:1111:2222:33333::4444:5555]""first.last@-xample.com""first.last@exampl-.com""first.last@x234567890123456789012345678901234567890123456789012345678901234.iana.org""abc\\@def@iana.org""abc\\@iana.org""\"Doug\\ \\\\\"Ace\\\\\"\\ Lovell@iana.org\"""abc@def@iana.org""abc\\@def@iana.org""abc\\@iana.org""@iana.org""doug@""\"\\\"qu@iana.org\"""\"ote\\\"@iana.org\""".dot@iana.org""dot.@iana.org""two..dot@iana.org""\"\\\"Doug \\\"Ace\\\" L.\\\"@iana.org\"""\"Doug\\ \\\\\"Ace\\\\\"\\ L\\.@iana.org\"""hello world@iana.org""gatsby@f.sc.ot.t.f.i.tzg.era.l.d.""test.iana.org""test.@iana.org""test..test@iana.org"".test@iana.org""test@test@iana.org""test@@iana.org""-- test --@iana.org""[test]@iana.org""\"\\\"test\\\"test\\\"@iana.org\"""()[]\\;:,><@iana.org""test@.""test@example.""test@.org""test@1234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890 [...]""test@[123.123.123.123""test@123.123.123.123]""NotAnEmail""@NotAnEmail""\"\\\"test\\\"blah\\\"@iana.org\""".wooly@iana.org""wo..oly@iana.org""pootietang.@iana.org"".@iana.org""Ima Fool@iana.org""phil.h\\@\\@ck@haacked.com""foo@[\\1.2.3.4]""\"first.\\\"\\\".last@iana.org\"""first\\last@iana.org""Abc\\@def@iana.org""Fred\\ Bloggs@iana.org""Joe.\\Blow@iana.org""first.last@[IPv6:1111:2222:3333:4444:5555:6666:12.34.567.89]""{^c\\@**Dog^}@cartoon.com""\"\\\"foo\\\"(yay)@(hoopla)[1.2.3.4]\"""cal(foo(bar)@iamcal.com""cal(foo)bar)@iamcal.com""cal(foo\\)@iamcal.com""first(12345678901234567890123456789012345678901234567890)last@(123456789012345678901234567890123456789012 [...]""first(middle)last@iana.org""\"first(abc(\\\"def\\\".ghi).mno)middle(abc(\\\"def\\\".ghi).mno).last@(abc(\\\"def\\\".ghi).mno)example(abc(\\\"def\\\".ghi).mno). [...]\"""a(a(b(c)d(e(f))g)(h(i)j)@iana.org"".@""@bar.com""@@bar.com""aaa.com""aaa@.com""aaa@.123""aaa@[123.123.123.123]a""aaa@[123.123.123.333]""a@bar.com.""a@-b.com""a@b-.com""-@..com""-@a..com""invalid@about.museum-""test@...........com""\"\\\"Unicode NULL \\\"@char.com\"""Unicode NULL @char.com""first.last@[IPv6::]""first.last@[IPv6::::]""first.last@[IPv6::b4]""first.last@[IPv6::::b4]""first.last@[IPv6::b3:b4]""first.last@[IPv6::::b3:b4]""first.last@[IPv6:a1:::b4]""first.last@[IPv6:a1:]""first.last@[IPv6:a1:::]""first.last@[IPv6:a1:a2:]""first.last@[IPv6:a1:a2:::]""first.last@[IPv6::11.22.33.44]""first.last@[IPv6::::11.22.33.44]""first.last@[IPv6:a1:11.22.33.44]""first.last@[IPv6:a1:::11.22.33.44]""first.last@[IPv6:a1:a2:::11.22.33.44]""first.last@[IPv6:0123:4567:89ab:cdef::11.22.33.xx]""first.last@[IPv6:0123:4567:89ab:CDEFF::11.22.33.44]""first.last@[IPv6:a1::a4:b1::b4:11.22.33.44]""first.last@[IPv6:a1::11.22.33]""first.last@[IPv6:a1::11.22.33.44.55]""first.last@[IPv6:a1::b211.22.33.44]""first.last@[IPv6:a1::b2::11.22.33.44]""first.last@[IPv6:a1::b3:]""first.last@[IPv6::a2::b4]""first.last@[IPv6:a1:a2:a3:a4:b1:b2:b3:]""first.last@[IPv6::a2:a3:a4:b1:b2:b3:b4]""first.last@[IPv6:a1:a2:a3:a4::b1:b2:b3:b4]");
     
     
    $counertAll 0;
    $counterValid 0;
    foreach (
    $arrayValid as $emailTest) {
        
    $counertAll++;
        if(
    is_email($emailTest)) {
            
    $counterValid++;
            echo 
    "$counterValid / $counertAll | $emailTest is a valid\n\r";
            }  else {    
    "$counterValid / $counertAll | $emailTest is a INVALID\n\r";
            }
    }

    foreach (
    $arrayInValid as $emailTest) {
        
    $counertAll++;
        if(
    is_email($emailTest)) {
            
    $counterValid++;
            echo 
    "$counterValid / $counertAll | $emailTest is a valid\n\r";
            }  else {    
    "$counterValid / $counertAll | $emailTest is a INVALID\n\r";
            }
    }

    // Valid: 96/134
    // Invalid: 130/132

    ?>
    Code:
    git clone https://github.com/dominicsayers/isemail
    cd ./isemail
    nano test_email.php # код сверху сюдым
    
    php -f test_email.php
    



    UPDATE: а бл.. ветка про питухон ;) уже запостил пыху
     
    #5 lifescore, 5 Jul 2022
    Last edited: 5 Jul 2022
  6. b3

    b3 Moderator

    Joined:
    5 Dec 2004
    Messages:
    2,041
    Likes Received:
    933
    Reputations:
    199
    у пыхи вообще из коробки можно https://www.php.net/manual/en/function.filter-var.php юзать с ключем FILTER_VALIDATE_EMAIL но там тоже есть нестыковка по RFC
     
    _________________________