Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat: add scan.netsecurity.ne.jp custom parser #347

Merged

Conversation

kik0220
Copy link
Contributor

@kik0220 kik0220 commented Mar 30, 2019

scan.netsecurity.ne.jp custom parser

@postlight-org
Copy link
Collaborator

🤖 Automated Parsing Preview 🤖

Commit: feat: add scan.netsecurity.ne.jp custom parser

Screenshot of fixture (this embed should work after repo is public)

Original Article | HTML Fixture | Parsed Content Preview

Parsed JSON
{
  "title": "パスワードロック未実施のUSBメモリを電車内で紛失の可能性(阪南大学) | ScanNetSecurity[国内最大級のサイバーセキュリティ専門ポータルサイト]",
  "content": "<div><div><div class=\"arti-content arti-content--thumbnail\">\n  <div class=\"arti-capt-thumbnail\">\n    <ul class=\"capt-thumb-list\">\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26698.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26698.jpg\" alt=\"&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26699.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26699.jpg\" alt=\"&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n    </ul>\n\n  </div>\n<article class=\"arti-body cf cXenseParse\">\n&#x962A;&#x5357;&#x5927;&#x5B66;&#x306F;3&#x6708;4&#x65E5;&#x3001;&#x540C;&#x5B66;&#x306E;&#x5C02;&#x4EFB;&#x6559;&#x54E1;&#x304C;&#x5B66;&#x751F;&#x60C5;&#x5831;&#x7B49;&#x3092;&#x4FDD;&#x5B58;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3053;&#x3068;&#x304C;&#x5224;&#x660E;&#x3057;&#x305F;&#x3068;&#x767A;&#x8868;&#x3057;&#x305F;&#x3002;<br><br>&#x3053;&#x308C;&#x306F;2&#x6708;2&#x65E5;&#x306B;&#x3001;&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306E;&#x81EA;&#x5B85;&#x304B;&#x3089;&#x30BC;&#x30DF;&#x306E;&#x30D5;&#x30A3;&#x30FC;&#x30EB;&#x30C9;&#x30EF;&#x30FC;&#x30AF;&#x306B;&#x5411;&#x304B;&#x3046;&#x96FB;&#x8ECA;&#x5185;&#x3067;&#x6301;&#x53C2;&#x3057;&#x3066;&#x3044;&#x305F;&#x30CE;&#x30FC;&#x30C8;&#x578B;&#x30D1;&#x30BD;&#x30B3;&#x30F3;&#x306B;&#x5B66;&#x751F;&#x306E;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x305F;&#x5C0F;&#x578B;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x63A5;&#x7D9A;&#x3057;&#x305F;&#x72B6;&#x614B;&#x3067;&#x4F5C;&#x696D;&#x3092;&#x884C;&#x3063;&#x305F;&#x969B;&#x306B;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3068;&#x63A8;&#x6E2C;&#x3055;&#x308C;&#x308B;&#x3068;&#x3044;&#x3046;&#x3082;&#x306E;&#x3002;<br><br>&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306F;&#x7D1B;&#x5931;&#x5224;&#x660E;&#x5F8C;&#x306B;&#x3001;&#x5468;&#x56F2;&#x306E;&#x635C;&#x7D22;&#x306A;&#x3089;&#x3073;&#x306B;&#x8B66;&#x5BDF;&#x3001;&#x9244;&#x9053;&#x4F1A;&#x793E;&#x3078;&#x907A;&#x5931;&#x7269;&#x306E;&#x5C4A;&#x51FA;&#x3092;&#x884C;&#x3063;&#x305F;&#x304C;&#x73FE;&#x6642;&#x70B9;&#x3067;&#x306F;&#x767A;&#x898B;&#x306B;&#x306F;&#x81F3;&#x3063;&#x3066;&#x3044;&#x306A;&#x3044;&#x3002;<br><br>&#x7D1B;&#x5931;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x306F;&#x3001;&#x5E73;&#x6210;27&#x5E74;&#x5EA6;&#x304B;&#x3089;&#x5E73;&#x6210;30&#x5E74;&#x5EA6;&#x958B;&#x8B1B;&#x306E;&#x4E00;&#x90E8;&#x79D1;&#x76EE;&#x5C65;&#x4FEE;&#x8005;&#x306E;&#x5B66;&#x7C4D;&#x756A;&#x53F7;&#x3001;&#x6C0F;&#x540D;&#x3001;&#x6210;&#x7E3E;&#x306E;&#x9014;&#x4E2D;&#x8A55;&#x4FA1;&#x306B;&#x95A2;&#x3059;&#x308B;&#x30C7;&#x30FC;&#x30BF;1,169&#x4EF6;&#x5206;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x3066;&#x3044;&#x305F;&#x3002;&#x306A;&#x304A;&#x3001;&#x5927;&#x5B66;&#x540D;&#x3084;&#x5B66;&#x751F;&#x306E;&#x4F4F;&#x6240;&#x3001;&#x96FB;&#x8A71;&#x756A;&#x53F7;&#x7B49;&#x306E;&#x4F4F;&#x5C45;&#x3084;&#x9023;&#x7D61;&#x5148;&#x3092;&#x7279;&#x5B9A;&#x3059;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x306F;&#x542B;&#x307E;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;&#x5F53;&#x8A72;USB&#x30E1;&#x30E2;&#x30EA;&#x53CA;&#x3073;&#x305D;&#x306E;&#x30C7;&#x30FC;&#x30BF;&#x306B;&#x3064;&#x3044;&#x3066;&#x3001;&#x30D1;&#x30B9;&#x30EF;&#x30FC;&#x30C9;&#x30ED;&#x30C3;&#x30AF;&#x7B49;&#x306E;&#x5BFE;&#x7B56;&#x306F;&#x5B9F;&#x65BD;&#x3057;&#x3066;&#x3044;&#x306A;&#x304B;&#x3063;&#x305F;&#x3002;<br><br>&#x540C;&#x5B66;&#x306B;&#x3088;&#x308B;&#x3068;&#x3001;&#x3053;&#x308C;&#x307E;&#x3067;&#x306B;&#x672C;&#x4EF6;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x4FDD;&#x7BA1;&#x3055;&#x308C;&#x3066;&#x3044;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x7B2C;&#x4E09;&#x8005;&#x3078;&#x306E;&#x6D41;&#x5931;&#x3084;&#x4E0D;&#x6B63;&#x4F7F;&#x7528;&#x306E;&#x4E8B;&#x5B9F;&#x306F;&#x78BA;&#x8A8D;&#x3055;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;<br><br>&#x65E2;&#x306B;&#x540C;&#x5B66;&#x3067;&#x306F;&#x3001;&#x8A72;&#x5F53;&#x3059;&#x308B;&#x5728;&#x5B66;&#x751F;&#x3084;&#x5352;&#x696D;&#x751F;&#x306B;&#x8B1D;&#x7F6A;&#x3068;&#x7D4C;&#x7DEF;&#x8AAC;&#x660E;&#x306E;&#x6587;&#x66F8;&#x3092;&#x9001;&#x4ED8;&#x3057;&#x3066;&#x3044;&#x308B;&#x3002;\n</article>\n<span class=\"writer writer-name\">&#x300A;ScanNetSecurity&#x300B;</span>\n\n\n</div></div></div>",
  "author": null,
  "date_published": "2019-03-04T23:15:11.000Z",
  "lead_image_url": "https://scan.netsecurity.ne.jp/imgs/ogp_f/26698.jpg",
  "dek": "阪南大学は3月4日、同学の専任教員が学生情報等を保存したUSBメモリを紛失したことが判明したと発表した。",
  "next_page_url": null,
  "url": "https://scan.netsecurity.ne.jp/article/2019/03/05/42049.html",
  "domain": "scan.netsecurity.ne.jp",
  "word_count": 6,
  "direction": "ltr",
  "total_pages": 1,
  "rendered_pages": 1
}

null fields

  • author

  • next_page_url

✅ All tests passed

@kik0220 kik0220 force-pushed the feat-scan-netsecurity-ne-jp-extractor branch from 3108794 to 5b1d9c2 Compare April 1, 2019 22:03
@postlight-org
Copy link
Collaborator

🤖 Automated Parsing Preview 🤖

Commit: Merge branch 'master' into feat-scan-netsecurity-ne-jp-extractor

Screenshot of fixture (this embed should work after repo is public)

Original Article | HTML Fixture | Parsed Content Preview

Parsed JSON
{
  "title": "パスワードロック未実施のUSBメモリを電車内で紛失の可能性(阪南大学)",
  "content": "<div><div class=\"arti-content arti-content--thumbnail\">\n  <div class=\"arti-capt-thumbnail\">\n    <ul class=\"capt-thumb-list\">\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26698.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26698.jpg\" alt=\"&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26699.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26699.jpg\" alt=\"&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n    </ul>\n\n  </div>\n<article class=\"arti-body cf cXenseParse\">\n&#x962A;&#x5357;&#x5927;&#x5B66;&#x306F;3&#x6708;4&#x65E5;&#x3001;&#x540C;&#x5B66;&#x306E;&#x5C02;&#x4EFB;&#x6559;&#x54E1;&#x304C;&#x5B66;&#x751F;&#x60C5;&#x5831;&#x7B49;&#x3092;&#x4FDD;&#x5B58;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3053;&#x3068;&#x304C;&#x5224;&#x660E;&#x3057;&#x305F;&#x3068;&#x767A;&#x8868;&#x3057;&#x305F;&#x3002;<br><br>&#x3053;&#x308C;&#x306F;2&#x6708;2&#x65E5;&#x306B;&#x3001;&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306E;&#x81EA;&#x5B85;&#x304B;&#x3089;&#x30BC;&#x30DF;&#x306E;&#x30D5;&#x30A3;&#x30FC;&#x30EB;&#x30C9;&#x30EF;&#x30FC;&#x30AF;&#x306B;&#x5411;&#x304B;&#x3046;&#x96FB;&#x8ECA;&#x5185;&#x3067;&#x6301;&#x53C2;&#x3057;&#x3066;&#x3044;&#x305F;&#x30CE;&#x30FC;&#x30C8;&#x578B;&#x30D1;&#x30BD;&#x30B3;&#x30F3;&#x306B;&#x5B66;&#x751F;&#x306E;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x305F;&#x5C0F;&#x578B;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x63A5;&#x7D9A;&#x3057;&#x305F;&#x72B6;&#x614B;&#x3067;&#x4F5C;&#x696D;&#x3092;&#x884C;&#x3063;&#x305F;&#x969B;&#x306B;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3068;&#x63A8;&#x6E2C;&#x3055;&#x308C;&#x308B;&#x3068;&#x3044;&#x3046;&#x3082;&#x306E;&#x3002;<br><br>&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306F;&#x7D1B;&#x5931;&#x5224;&#x660E;&#x5F8C;&#x306B;&#x3001;&#x5468;&#x56F2;&#x306E;&#x635C;&#x7D22;&#x306A;&#x3089;&#x3073;&#x306B;&#x8B66;&#x5BDF;&#x3001;&#x9244;&#x9053;&#x4F1A;&#x793E;&#x3078;&#x907A;&#x5931;&#x7269;&#x306E;&#x5C4A;&#x51FA;&#x3092;&#x884C;&#x3063;&#x305F;&#x304C;&#x73FE;&#x6642;&#x70B9;&#x3067;&#x306F;&#x767A;&#x898B;&#x306B;&#x306F;&#x81F3;&#x3063;&#x3066;&#x3044;&#x306A;&#x3044;&#x3002;<br><br>&#x7D1B;&#x5931;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x306F;&#x3001;&#x5E73;&#x6210;27&#x5E74;&#x5EA6;&#x304B;&#x3089;&#x5E73;&#x6210;30&#x5E74;&#x5EA6;&#x958B;&#x8B1B;&#x306E;&#x4E00;&#x90E8;&#x79D1;&#x76EE;&#x5C65;&#x4FEE;&#x8005;&#x306E;&#x5B66;&#x7C4D;&#x756A;&#x53F7;&#x3001;&#x6C0F;&#x540D;&#x3001;&#x6210;&#x7E3E;&#x306E;&#x9014;&#x4E2D;&#x8A55;&#x4FA1;&#x306B;&#x95A2;&#x3059;&#x308B;&#x30C7;&#x30FC;&#x30BF;1,169&#x4EF6;&#x5206;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x3066;&#x3044;&#x305F;&#x3002;&#x306A;&#x304A;&#x3001;&#x5927;&#x5B66;&#x540D;&#x3084;&#x5B66;&#x751F;&#x306E;&#x4F4F;&#x6240;&#x3001;&#x96FB;&#x8A71;&#x756A;&#x53F7;&#x7B49;&#x306E;&#x4F4F;&#x5C45;&#x3084;&#x9023;&#x7D61;&#x5148;&#x3092;&#x7279;&#x5B9A;&#x3059;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x306F;&#x542B;&#x307E;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;&#x5F53;&#x8A72;USB&#x30E1;&#x30E2;&#x30EA;&#x53CA;&#x3073;&#x305D;&#x306E;&#x30C7;&#x30FC;&#x30BF;&#x306B;&#x3064;&#x3044;&#x3066;&#x3001;&#x30D1;&#x30B9;&#x30EF;&#x30FC;&#x30C9;&#x30ED;&#x30C3;&#x30AF;&#x7B49;&#x306E;&#x5BFE;&#x7B56;&#x306F;&#x5B9F;&#x65BD;&#x3057;&#x3066;&#x3044;&#x306A;&#x304B;&#x3063;&#x305F;&#x3002;<br><br>&#x540C;&#x5B66;&#x306B;&#x3088;&#x308B;&#x3068;&#x3001;&#x3053;&#x308C;&#x307E;&#x3067;&#x306B;&#x672C;&#x4EF6;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x4FDD;&#x7BA1;&#x3055;&#x308C;&#x3066;&#x3044;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x7B2C;&#x4E09;&#x8005;&#x3078;&#x306E;&#x6D41;&#x5931;&#x3084;&#x4E0D;&#x6B63;&#x4F7F;&#x7528;&#x306E;&#x4E8B;&#x5B9F;&#x306F;&#x78BA;&#x8A8D;&#x3055;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;<br><br>&#x65E2;&#x306B;&#x540C;&#x5B66;&#x3067;&#x306F;&#x3001;&#x8A72;&#x5F53;&#x3059;&#x308B;&#x5728;&#x5B66;&#x751F;&#x3084;&#x5352;&#x696D;&#x751F;&#x306B;&#x8B1D;&#x7F6A;&#x3068;&#x7D4C;&#x7DEF;&#x8AAC;&#x660E;&#x306E;&#x6587;&#x66F8;&#x3092;&#x9001;&#x4ED8;&#x3057;&#x3066;&#x3044;&#x308B;&#x3002;\n</article>\n<span class=\"writer writer-name\">&#x300A;ScanNetSecurity&#x300B;</span>\n\n\n</div></div>",
  "author": null,
  "date_published": "2019-03-04T23:15:11.000Z",
  "lead_image_url": "https://scan.netsecurity.ne.jp/imgs/ogp_f/26698.jpg",
  "dek": "阪南大学は3月4日、同学の専任教員が学生情報等を保存したUSBメモリを紛失したことが判明したと発表した。",
  "next_page_url": null,
  "url": "https://scan.netsecurity.ne.jp/article/2019/03/05/42049.html",
  "domain": "scan.netsecurity.ne.jp",
  "word_count": 6,
  "direction": "ltr",
  "total_pages": 1,
  "rendered_pages": 1
}

null fields

  • author

  • next_page_url

✅ All tests passed

1 similar comment
@postlight-org
Copy link
Collaborator

🤖 Automated Parsing Preview 🤖

Commit: Merge branch 'master' into feat-scan-netsecurity-ne-jp-extractor

Screenshot of fixture (this embed should work after repo is public)

Original Article | HTML Fixture | Parsed Content Preview

Parsed JSON
{
  "title": "パスワードロック未実施のUSBメモリを電車内で紛失の可能性(阪南大学)",
  "content": "<div><div class=\"arti-content arti-content--thumbnail\">\n  <div class=\"arti-capt-thumbnail\">\n    <ul class=\"capt-thumb-list\">\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26698.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26698.jpg\" alt=\"&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26699.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26699.jpg\" alt=\"&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n    </ul>\n\n  </div>\n<article class=\"arti-body cf cXenseParse\">\n&#x962A;&#x5357;&#x5927;&#x5B66;&#x306F;3&#x6708;4&#x65E5;&#x3001;&#x540C;&#x5B66;&#x306E;&#x5C02;&#x4EFB;&#x6559;&#x54E1;&#x304C;&#x5B66;&#x751F;&#x60C5;&#x5831;&#x7B49;&#x3092;&#x4FDD;&#x5B58;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3053;&#x3068;&#x304C;&#x5224;&#x660E;&#x3057;&#x305F;&#x3068;&#x767A;&#x8868;&#x3057;&#x305F;&#x3002;<br><br>&#x3053;&#x308C;&#x306F;2&#x6708;2&#x65E5;&#x306B;&#x3001;&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306E;&#x81EA;&#x5B85;&#x304B;&#x3089;&#x30BC;&#x30DF;&#x306E;&#x30D5;&#x30A3;&#x30FC;&#x30EB;&#x30C9;&#x30EF;&#x30FC;&#x30AF;&#x306B;&#x5411;&#x304B;&#x3046;&#x96FB;&#x8ECA;&#x5185;&#x3067;&#x6301;&#x53C2;&#x3057;&#x3066;&#x3044;&#x305F;&#x30CE;&#x30FC;&#x30C8;&#x578B;&#x30D1;&#x30BD;&#x30B3;&#x30F3;&#x306B;&#x5B66;&#x751F;&#x306E;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x305F;&#x5C0F;&#x578B;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x63A5;&#x7D9A;&#x3057;&#x305F;&#x72B6;&#x614B;&#x3067;&#x4F5C;&#x696D;&#x3092;&#x884C;&#x3063;&#x305F;&#x969B;&#x306B;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3068;&#x63A8;&#x6E2C;&#x3055;&#x308C;&#x308B;&#x3068;&#x3044;&#x3046;&#x3082;&#x306E;&#x3002;<br><br>&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306F;&#x7D1B;&#x5931;&#x5224;&#x660E;&#x5F8C;&#x306B;&#x3001;&#x5468;&#x56F2;&#x306E;&#x635C;&#x7D22;&#x306A;&#x3089;&#x3073;&#x306B;&#x8B66;&#x5BDF;&#x3001;&#x9244;&#x9053;&#x4F1A;&#x793E;&#x3078;&#x907A;&#x5931;&#x7269;&#x306E;&#x5C4A;&#x51FA;&#x3092;&#x884C;&#x3063;&#x305F;&#x304C;&#x73FE;&#x6642;&#x70B9;&#x3067;&#x306F;&#x767A;&#x898B;&#x306B;&#x306F;&#x81F3;&#x3063;&#x3066;&#x3044;&#x306A;&#x3044;&#x3002;<br><br>&#x7D1B;&#x5931;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x306F;&#x3001;&#x5E73;&#x6210;27&#x5E74;&#x5EA6;&#x304B;&#x3089;&#x5E73;&#x6210;30&#x5E74;&#x5EA6;&#x958B;&#x8B1B;&#x306E;&#x4E00;&#x90E8;&#x79D1;&#x76EE;&#x5C65;&#x4FEE;&#x8005;&#x306E;&#x5B66;&#x7C4D;&#x756A;&#x53F7;&#x3001;&#x6C0F;&#x540D;&#x3001;&#x6210;&#x7E3E;&#x306E;&#x9014;&#x4E2D;&#x8A55;&#x4FA1;&#x306B;&#x95A2;&#x3059;&#x308B;&#x30C7;&#x30FC;&#x30BF;1,169&#x4EF6;&#x5206;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x3066;&#x3044;&#x305F;&#x3002;&#x306A;&#x304A;&#x3001;&#x5927;&#x5B66;&#x540D;&#x3084;&#x5B66;&#x751F;&#x306E;&#x4F4F;&#x6240;&#x3001;&#x96FB;&#x8A71;&#x756A;&#x53F7;&#x7B49;&#x306E;&#x4F4F;&#x5C45;&#x3084;&#x9023;&#x7D61;&#x5148;&#x3092;&#x7279;&#x5B9A;&#x3059;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x306F;&#x542B;&#x307E;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;&#x5F53;&#x8A72;USB&#x30E1;&#x30E2;&#x30EA;&#x53CA;&#x3073;&#x305D;&#x306E;&#x30C7;&#x30FC;&#x30BF;&#x306B;&#x3064;&#x3044;&#x3066;&#x3001;&#x30D1;&#x30B9;&#x30EF;&#x30FC;&#x30C9;&#x30ED;&#x30C3;&#x30AF;&#x7B49;&#x306E;&#x5BFE;&#x7B56;&#x306F;&#x5B9F;&#x65BD;&#x3057;&#x3066;&#x3044;&#x306A;&#x304B;&#x3063;&#x305F;&#x3002;<br><br>&#x540C;&#x5B66;&#x306B;&#x3088;&#x308B;&#x3068;&#x3001;&#x3053;&#x308C;&#x307E;&#x3067;&#x306B;&#x672C;&#x4EF6;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x4FDD;&#x7BA1;&#x3055;&#x308C;&#x3066;&#x3044;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x7B2C;&#x4E09;&#x8005;&#x3078;&#x306E;&#x6D41;&#x5931;&#x3084;&#x4E0D;&#x6B63;&#x4F7F;&#x7528;&#x306E;&#x4E8B;&#x5B9F;&#x306F;&#x78BA;&#x8A8D;&#x3055;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;<br><br>&#x65E2;&#x306B;&#x540C;&#x5B66;&#x3067;&#x306F;&#x3001;&#x8A72;&#x5F53;&#x3059;&#x308B;&#x5728;&#x5B66;&#x751F;&#x3084;&#x5352;&#x696D;&#x751F;&#x306B;&#x8B1D;&#x7F6A;&#x3068;&#x7D4C;&#x7DEF;&#x8AAC;&#x660E;&#x306E;&#x6587;&#x66F8;&#x3092;&#x9001;&#x4ED8;&#x3057;&#x3066;&#x3044;&#x308B;&#x3002;\n</article>\n<span class=\"writer writer-name\">&#x300A;ScanNetSecurity&#x300B;</span>\n\n\n</div></div>",
  "author": null,
  "date_published": "2019-03-04T23:15:11.000Z",
  "lead_image_url": "https://scan.netsecurity.ne.jp/imgs/ogp_f/26698.jpg",
  "dek": "阪南大学は3月4日、同学の専任教員が学生情報等を保存したUSBメモリを紛失したことが判明したと発表した。",
  "next_page_url": null,
  "url": "https://scan.netsecurity.ne.jp/article/2019/03/05/42049.html",
  "domain": "scan.netsecurity.ne.jp",
  "word_count": 6,
  "direction": "ltr",
  "total_pages": 1,
  "rendered_pages": 1
}

null fields

  • author

  • next_page_url

✅ All tests passed

@kik0220 kik0220 force-pushed the feat-scan-netsecurity-ne-jp-extractor branch from 0897df6 to 9a25a4e Compare April 6, 2019 21:56
@postlight-org
Copy link
Collaborator

🤖 Automated Parsing Preview 🤖

Commit: feat: add scan.netsecurity.ne.jp custom parser

Screenshot of fixture (this embed should work after repo is public)

Original Article | HTML Fixture | Parsed Content Preview

Parsed JSON
{
  "title": "パスワードロック未実施のUSBメモリを電車内で紛失の可能性(阪南大学)",
  "content": "<div><div class=\"arti-content arti-content--thumbnail\">\n  <div class=\"arti-capt-thumbnail\">\n    <ul class=\"capt-thumb-list\">\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26698.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26698.jpg\" alt=\"&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26699.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26699.jpg\" alt=\"&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n    </ul>\n\n  </div>\n<article class=\"arti-body cf cXenseParse\">\n&#x962A;&#x5357;&#x5927;&#x5B66;&#x306F;3&#x6708;4&#x65E5;&#x3001;&#x540C;&#x5B66;&#x306E;&#x5C02;&#x4EFB;&#x6559;&#x54E1;&#x304C;&#x5B66;&#x751F;&#x60C5;&#x5831;&#x7B49;&#x3092;&#x4FDD;&#x5B58;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3053;&#x3068;&#x304C;&#x5224;&#x660E;&#x3057;&#x305F;&#x3068;&#x767A;&#x8868;&#x3057;&#x305F;&#x3002;<br><br>&#x3053;&#x308C;&#x306F;2&#x6708;2&#x65E5;&#x306B;&#x3001;&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306E;&#x81EA;&#x5B85;&#x304B;&#x3089;&#x30BC;&#x30DF;&#x306E;&#x30D5;&#x30A3;&#x30FC;&#x30EB;&#x30C9;&#x30EF;&#x30FC;&#x30AF;&#x306B;&#x5411;&#x304B;&#x3046;&#x96FB;&#x8ECA;&#x5185;&#x3067;&#x6301;&#x53C2;&#x3057;&#x3066;&#x3044;&#x305F;&#x30CE;&#x30FC;&#x30C8;&#x578B;&#x30D1;&#x30BD;&#x30B3;&#x30F3;&#x306B;&#x5B66;&#x751F;&#x306E;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x305F;&#x5C0F;&#x578B;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x63A5;&#x7D9A;&#x3057;&#x305F;&#x72B6;&#x614B;&#x3067;&#x4F5C;&#x696D;&#x3092;&#x884C;&#x3063;&#x305F;&#x969B;&#x306B;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3068;&#x63A8;&#x6E2C;&#x3055;&#x308C;&#x308B;&#x3068;&#x3044;&#x3046;&#x3082;&#x306E;&#x3002;<br><br>&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306F;&#x7D1B;&#x5931;&#x5224;&#x660E;&#x5F8C;&#x306B;&#x3001;&#x5468;&#x56F2;&#x306E;&#x635C;&#x7D22;&#x306A;&#x3089;&#x3073;&#x306B;&#x8B66;&#x5BDF;&#x3001;&#x9244;&#x9053;&#x4F1A;&#x793E;&#x3078;&#x907A;&#x5931;&#x7269;&#x306E;&#x5C4A;&#x51FA;&#x3092;&#x884C;&#x3063;&#x305F;&#x304C;&#x73FE;&#x6642;&#x70B9;&#x3067;&#x306F;&#x767A;&#x898B;&#x306B;&#x306F;&#x81F3;&#x3063;&#x3066;&#x3044;&#x306A;&#x3044;&#x3002;<br><br>&#x7D1B;&#x5931;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x306F;&#x3001;&#x5E73;&#x6210;27&#x5E74;&#x5EA6;&#x304B;&#x3089;&#x5E73;&#x6210;30&#x5E74;&#x5EA6;&#x958B;&#x8B1B;&#x306E;&#x4E00;&#x90E8;&#x79D1;&#x76EE;&#x5C65;&#x4FEE;&#x8005;&#x306E;&#x5B66;&#x7C4D;&#x756A;&#x53F7;&#x3001;&#x6C0F;&#x540D;&#x3001;&#x6210;&#x7E3E;&#x306E;&#x9014;&#x4E2D;&#x8A55;&#x4FA1;&#x306B;&#x95A2;&#x3059;&#x308B;&#x30C7;&#x30FC;&#x30BF;1,169&#x4EF6;&#x5206;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x3066;&#x3044;&#x305F;&#x3002;&#x306A;&#x304A;&#x3001;&#x5927;&#x5B66;&#x540D;&#x3084;&#x5B66;&#x751F;&#x306E;&#x4F4F;&#x6240;&#x3001;&#x96FB;&#x8A71;&#x756A;&#x53F7;&#x7B49;&#x306E;&#x4F4F;&#x5C45;&#x3084;&#x9023;&#x7D61;&#x5148;&#x3092;&#x7279;&#x5B9A;&#x3059;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x306F;&#x542B;&#x307E;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;&#x5F53;&#x8A72;USB&#x30E1;&#x30E2;&#x30EA;&#x53CA;&#x3073;&#x305D;&#x306E;&#x30C7;&#x30FC;&#x30BF;&#x306B;&#x3064;&#x3044;&#x3066;&#x3001;&#x30D1;&#x30B9;&#x30EF;&#x30FC;&#x30C9;&#x30ED;&#x30C3;&#x30AF;&#x7B49;&#x306E;&#x5BFE;&#x7B56;&#x306F;&#x5B9F;&#x65BD;&#x3057;&#x3066;&#x3044;&#x306A;&#x304B;&#x3063;&#x305F;&#x3002;<br><br>&#x540C;&#x5B66;&#x306B;&#x3088;&#x308B;&#x3068;&#x3001;&#x3053;&#x308C;&#x307E;&#x3067;&#x306B;&#x672C;&#x4EF6;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x4FDD;&#x7BA1;&#x3055;&#x308C;&#x3066;&#x3044;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x7B2C;&#x4E09;&#x8005;&#x3078;&#x306E;&#x6D41;&#x5931;&#x3084;&#x4E0D;&#x6B63;&#x4F7F;&#x7528;&#x306E;&#x4E8B;&#x5B9F;&#x306F;&#x78BA;&#x8A8D;&#x3055;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;<br><br>&#x65E2;&#x306B;&#x540C;&#x5B66;&#x3067;&#x306F;&#x3001;&#x8A72;&#x5F53;&#x3059;&#x308B;&#x5728;&#x5B66;&#x751F;&#x3084;&#x5352;&#x696D;&#x751F;&#x306B;&#x8B1D;&#x7F6A;&#x3068;&#x7D4C;&#x7DEF;&#x8AAC;&#x660E;&#x306E;&#x6587;&#x66F8;&#x3092;&#x9001;&#x4ED8;&#x3057;&#x3066;&#x3044;&#x308B;&#x3002;\n</article>\n<span class=\"writer writer-name\">&#x300A;ScanNetSecurity&#x300B;</span>\n\n\n</div></div>",
  "author": null,
  "date_published": "2019-03-04T23:15:11.000Z",
  "lead_image_url": "https://scan.netsecurity.ne.jp/imgs/ogp_f/26698.jpg",
  "dek": "阪南大学は3月4日、同学の専任教員が学生情報等を保存したUSBメモリを紛失したことが判明したと発表した。",
  "next_page_url": null,
  "url": "https://scan.netsecurity.ne.jp/article/2019/03/05/42049.html",
  "domain": "scan.netsecurity.ne.jp",
  "word_count": 6,
  "direction": "ltr",
  "total_pages": 1,
  "rendered_pages": 1
}

null fields

  • author

  • next_page_url

✅ All tests passed

@kik0220 kik0220 force-pushed the feat-scan-netsecurity-ne-jp-extractor branch from 9a25a4e to 2903edc Compare April 7, 2019 00:35
@postlight-org
Copy link
Collaborator

🤖 Automated Parsing Preview 🤖

Commit: feat: add scan.netsecurity.ne.jp custom parser

Screenshot of fixture (this embed should work after repo is public)

Original Article | HTML Fixture | Parsed Content Preview

Parsed JSON
{
  "title": "パスワードロック未実施のUSBメモリを電車内で紛失の可能性(阪南大学)",
  "content": "<div><div class=\"arti-content arti-content--thumbnail\">\n  <div class=\"arti-capt-thumbnail\">\n    <ul class=\"capt-thumb-list\">\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26698.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26698.jpg\" alt=\"&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26699.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26699.jpg\" alt=\"&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n    </ul>\n\n  </div>\n<article class=\"arti-body cf cXenseParse\">\n&#x962A;&#x5357;&#x5927;&#x5B66;&#x306F;3&#x6708;4&#x65E5;&#x3001;&#x540C;&#x5B66;&#x306E;&#x5C02;&#x4EFB;&#x6559;&#x54E1;&#x304C;&#x5B66;&#x751F;&#x60C5;&#x5831;&#x7B49;&#x3092;&#x4FDD;&#x5B58;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3053;&#x3068;&#x304C;&#x5224;&#x660E;&#x3057;&#x305F;&#x3068;&#x767A;&#x8868;&#x3057;&#x305F;&#x3002;<br><br>&#x3053;&#x308C;&#x306F;2&#x6708;2&#x65E5;&#x306B;&#x3001;&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306E;&#x81EA;&#x5B85;&#x304B;&#x3089;&#x30BC;&#x30DF;&#x306E;&#x30D5;&#x30A3;&#x30FC;&#x30EB;&#x30C9;&#x30EF;&#x30FC;&#x30AF;&#x306B;&#x5411;&#x304B;&#x3046;&#x96FB;&#x8ECA;&#x5185;&#x3067;&#x6301;&#x53C2;&#x3057;&#x3066;&#x3044;&#x305F;&#x30CE;&#x30FC;&#x30C8;&#x578B;&#x30D1;&#x30BD;&#x30B3;&#x30F3;&#x306B;&#x5B66;&#x751F;&#x306E;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x305F;&#x5C0F;&#x578B;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x63A5;&#x7D9A;&#x3057;&#x305F;&#x72B6;&#x614B;&#x3067;&#x4F5C;&#x696D;&#x3092;&#x884C;&#x3063;&#x305F;&#x969B;&#x306B;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3068;&#x63A8;&#x6E2C;&#x3055;&#x308C;&#x308B;&#x3068;&#x3044;&#x3046;&#x3082;&#x306E;&#x3002;<br><br>&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306F;&#x7D1B;&#x5931;&#x5224;&#x660E;&#x5F8C;&#x306B;&#x3001;&#x5468;&#x56F2;&#x306E;&#x635C;&#x7D22;&#x306A;&#x3089;&#x3073;&#x306B;&#x8B66;&#x5BDF;&#x3001;&#x9244;&#x9053;&#x4F1A;&#x793E;&#x3078;&#x907A;&#x5931;&#x7269;&#x306E;&#x5C4A;&#x51FA;&#x3092;&#x884C;&#x3063;&#x305F;&#x304C;&#x73FE;&#x6642;&#x70B9;&#x3067;&#x306F;&#x767A;&#x898B;&#x306B;&#x306F;&#x81F3;&#x3063;&#x3066;&#x3044;&#x306A;&#x3044;&#x3002;<br><br>&#x7D1B;&#x5931;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x306F;&#x3001;&#x5E73;&#x6210;27&#x5E74;&#x5EA6;&#x304B;&#x3089;&#x5E73;&#x6210;30&#x5E74;&#x5EA6;&#x958B;&#x8B1B;&#x306E;&#x4E00;&#x90E8;&#x79D1;&#x76EE;&#x5C65;&#x4FEE;&#x8005;&#x306E;&#x5B66;&#x7C4D;&#x756A;&#x53F7;&#x3001;&#x6C0F;&#x540D;&#x3001;&#x6210;&#x7E3E;&#x306E;&#x9014;&#x4E2D;&#x8A55;&#x4FA1;&#x306B;&#x95A2;&#x3059;&#x308B;&#x30C7;&#x30FC;&#x30BF;1,169&#x4EF6;&#x5206;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x3066;&#x3044;&#x305F;&#x3002;&#x306A;&#x304A;&#x3001;&#x5927;&#x5B66;&#x540D;&#x3084;&#x5B66;&#x751F;&#x306E;&#x4F4F;&#x6240;&#x3001;&#x96FB;&#x8A71;&#x756A;&#x53F7;&#x7B49;&#x306E;&#x4F4F;&#x5C45;&#x3084;&#x9023;&#x7D61;&#x5148;&#x3092;&#x7279;&#x5B9A;&#x3059;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x306F;&#x542B;&#x307E;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;&#x5F53;&#x8A72;USB&#x30E1;&#x30E2;&#x30EA;&#x53CA;&#x3073;&#x305D;&#x306E;&#x30C7;&#x30FC;&#x30BF;&#x306B;&#x3064;&#x3044;&#x3066;&#x3001;&#x30D1;&#x30B9;&#x30EF;&#x30FC;&#x30C9;&#x30ED;&#x30C3;&#x30AF;&#x7B49;&#x306E;&#x5BFE;&#x7B56;&#x306F;&#x5B9F;&#x65BD;&#x3057;&#x3066;&#x3044;&#x306A;&#x304B;&#x3063;&#x305F;&#x3002;<br><br>&#x540C;&#x5B66;&#x306B;&#x3088;&#x308B;&#x3068;&#x3001;&#x3053;&#x308C;&#x307E;&#x3067;&#x306B;&#x672C;&#x4EF6;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x4FDD;&#x7BA1;&#x3055;&#x308C;&#x3066;&#x3044;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x7B2C;&#x4E09;&#x8005;&#x3078;&#x306E;&#x6D41;&#x5931;&#x3084;&#x4E0D;&#x6B63;&#x4F7F;&#x7528;&#x306E;&#x4E8B;&#x5B9F;&#x306F;&#x78BA;&#x8A8D;&#x3055;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;<br><br>&#x65E2;&#x306B;&#x540C;&#x5B66;&#x3067;&#x306F;&#x3001;&#x8A72;&#x5F53;&#x3059;&#x308B;&#x5728;&#x5B66;&#x751F;&#x3084;&#x5352;&#x696D;&#x751F;&#x306B;&#x8B1D;&#x7F6A;&#x3068;&#x7D4C;&#x7DEF;&#x8AAC;&#x660E;&#x306E;&#x6587;&#x66F8;&#x3092;&#x9001;&#x4ED8;&#x3057;&#x3066;&#x3044;&#x308B;&#x3002;\n</article>\n<span class=\"writer writer-name\">&#x300A;ScanNetSecurity&#x300B;</span>\n\n\n</div></div>",
  "author": null,
  "date_published": "2019-03-04T23:15:11.000Z",
  "lead_image_url": "https://scan.netsecurity.ne.jp/imgs/ogp_f/26698.jpg",
  "dek": "阪南大学は3月4日、同学の専任教員が学生情報等を保存したUSBメモリを紛失したことが判明したと発表した。",
  "next_page_url": null,
  "url": "https://scan.netsecurity.ne.jp/article/2019/03/05/42049.html",
  "domain": "scan.netsecurity.ne.jp",
  "word_count": 6,
  "direction": "ltr",
  "total_pages": 1,
  "rendered_pages": 1
}

null fields

  • author

  • next_page_url

✅ All tests passed

@toufic-m toufic-m merged commit 8493d05 into postlight:master Apr 9, 2019
@postlight-org
Copy link
Collaborator

🤖 Automated Parsing Preview 🤖

Commit: Merge branch 'master' into feat-scan-netsecurity-ne-jp-extractor

Screenshot of fixture (this embed should work after repo is public)

Original Article | HTML Fixture | Parsed Content Preview

Parsed JSON
{
  "title": "パスワードロック未実施のUSBメモリを電車内で紛失の可能性(阪南大学)",
  "content": "<div><div class=\"arti-content arti-content--thumbnail\">\n  <div class=\"arti-capt-thumbnail\">\n    <ul class=\"capt-thumb-list\">\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26698.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26698.jpg\" alt=\"&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x516C;&#x5F0F;&#x30B5;&#x30A4;&#x30C8;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n      <li class=\"item\"><a class=\"link\" href=\"https://scan.netsecurity.ne.jp/article/img/2019/03/05/42049/26699.html\">\n        <figure class=\"figure\">\n          <img class=\"image\" src=\"https://scan.netsecurity.ne.jp/imgs/p/2w5IdCqve0mMIzS4K5kC-28IDAerBQQDAgEA/26699.jpg\" alt=\"&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;\">\n          <figcaption class=\"figcaption\">\n            <span class=\"title\">&#x30EA;&#x30EA;&#x30FC;&#x30B9;&#xFF08;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x3092;&#x542B;&#x3080;USB&#x30E1;&#x30E2;&#x30EA;&#x7D1B;&#x5931;&#x306E;&#x304A;&#x8A6B;&#x3073;&#x3068;&#x304A;&#x77E5;&#x3089;&#x305B;&#xFF09;</span>\n          </figcaption>\n        </figure>\n      </a></li>\n    </ul>\n\n  </div>\n<article class=\"arti-body cf cXenseParse\">\n&#x962A;&#x5357;&#x5927;&#x5B66;&#x306F;3&#x6708;4&#x65E5;&#x3001;&#x540C;&#x5B66;&#x306E;&#x5C02;&#x4EFB;&#x6559;&#x54E1;&#x304C;&#x5B66;&#x751F;&#x60C5;&#x5831;&#x7B49;&#x3092;&#x4FDD;&#x5B58;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3053;&#x3068;&#x304C;&#x5224;&#x660E;&#x3057;&#x305F;&#x3068;&#x767A;&#x8868;&#x3057;&#x305F;&#x3002;<br><br>&#x3053;&#x308C;&#x306F;2&#x6708;2&#x65E5;&#x306B;&#x3001;&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306E;&#x81EA;&#x5B85;&#x304B;&#x3089;&#x30BC;&#x30DF;&#x306E;&#x30D5;&#x30A3;&#x30FC;&#x30EB;&#x30C9;&#x30EF;&#x30FC;&#x30AF;&#x306B;&#x5411;&#x304B;&#x3046;&#x96FB;&#x8ECA;&#x5185;&#x3067;&#x6301;&#x53C2;&#x3057;&#x3066;&#x3044;&#x305F;&#x30CE;&#x30FC;&#x30C8;&#x578B;&#x30D1;&#x30BD;&#x30B3;&#x30F3;&#x306B;&#x5B66;&#x751F;&#x306E;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x305F;&#x5C0F;&#x578B;USB&#x30E1;&#x30E2;&#x30EA;&#x3092;&#x63A5;&#x7D9A;&#x3057;&#x305F;&#x72B6;&#x614B;&#x3067;&#x4F5C;&#x696D;&#x3092;&#x884C;&#x3063;&#x305F;&#x969B;&#x306B;&#x7D1B;&#x5931;&#x3057;&#x305F;&#x3068;&#x63A8;&#x6E2C;&#x3055;&#x308C;&#x308B;&#x3068;&#x3044;&#x3046;&#x3082;&#x306E;&#x3002;<br><br>&#x5F53;&#x8A72;&#x6559;&#x54E1;&#x306F;&#x7D1B;&#x5931;&#x5224;&#x660E;&#x5F8C;&#x306B;&#x3001;&#x5468;&#x56F2;&#x306E;&#x635C;&#x7D22;&#x306A;&#x3089;&#x3073;&#x306B;&#x8B66;&#x5BDF;&#x3001;&#x9244;&#x9053;&#x4F1A;&#x793E;&#x3078;&#x907A;&#x5931;&#x7269;&#x306E;&#x5C4A;&#x51FA;&#x3092;&#x884C;&#x3063;&#x305F;&#x304C;&#x73FE;&#x6642;&#x70B9;&#x3067;&#x306F;&#x767A;&#x898B;&#x306B;&#x306F;&#x81F3;&#x3063;&#x3066;&#x3044;&#x306A;&#x3044;&#x3002;<br><br>&#x7D1B;&#x5931;&#x3057;&#x305F;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x306F;&#x3001;&#x5E73;&#x6210;27&#x5E74;&#x5EA6;&#x304B;&#x3089;&#x5E73;&#x6210;30&#x5E74;&#x5EA6;&#x958B;&#x8B1B;&#x306E;&#x4E00;&#x90E8;&#x79D1;&#x76EE;&#x5C65;&#x4FEE;&#x8005;&#x306E;&#x5B66;&#x7C4D;&#x756A;&#x53F7;&#x3001;&#x6C0F;&#x540D;&#x3001;&#x6210;&#x7E3E;&#x306E;&#x9014;&#x4E2D;&#x8A55;&#x4FA1;&#x306B;&#x95A2;&#x3059;&#x308B;&#x30C7;&#x30FC;&#x30BF;1,169&#x4EF6;&#x5206;&#x304C;&#x4FDD;&#x5B58;&#x3055;&#x308C;&#x3066;&#x3044;&#x305F;&#x3002;&#x306A;&#x304A;&#x3001;&#x5927;&#x5B66;&#x540D;&#x3084;&#x5B66;&#x751F;&#x306E;&#x4F4F;&#x6240;&#x3001;&#x96FB;&#x8A71;&#x756A;&#x53F7;&#x7B49;&#x306E;&#x4F4F;&#x5C45;&#x3084;&#x9023;&#x7D61;&#x5148;&#x3092;&#x7279;&#x5B9A;&#x3059;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x306F;&#x542B;&#x307E;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;&#x5F53;&#x8A72;USB&#x30E1;&#x30E2;&#x30EA;&#x53CA;&#x3073;&#x305D;&#x306E;&#x30C7;&#x30FC;&#x30BF;&#x306B;&#x3064;&#x3044;&#x3066;&#x3001;&#x30D1;&#x30B9;&#x30EF;&#x30FC;&#x30C9;&#x30ED;&#x30C3;&#x30AF;&#x7B49;&#x306E;&#x5BFE;&#x7B56;&#x306F;&#x5B9F;&#x65BD;&#x3057;&#x3066;&#x3044;&#x306A;&#x304B;&#x3063;&#x305F;&#x3002;<br><br>&#x540C;&#x5B66;&#x306B;&#x3088;&#x308B;&#x3068;&#x3001;&#x3053;&#x308C;&#x307E;&#x3067;&#x306B;&#x672C;&#x4EF6;USB&#x30E1;&#x30E2;&#x30EA;&#x306B;&#x4FDD;&#x7BA1;&#x3055;&#x308C;&#x3066;&#x3044;&#x308B;&#x500B;&#x4EBA;&#x60C5;&#x5831;&#x304C;&#x7B2C;&#x4E09;&#x8005;&#x3078;&#x306E;&#x6D41;&#x5931;&#x3084;&#x4E0D;&#x6B63;&#x4F7F;&#x7528;&#x306E;&#x4E8B;&#x5B9F;&#x306F;&#x78BA;&#x8A8D;&#x3055;&#x308C;&#x3066;&#x3044;&#x306A;&#x3044;&#x3068;&#x306E;&#x3053;&#x3068;&#x3002;<br><br>&#x65E2;&#x306B;&#x540C;&#x5B66;&#x3067;&#x306F;&#x3001;&#x8A72;&#x5F53;&#x3059;&#x308B;&#x5728;&#x5B66;&#x751F;&#x3084;&#x5352;&#x696D;&#x751F;&#x306B;&#x8B1D;&#x7F6A;&#x3068;&#x7D4C;&#x7DEF;&#x8AAC;&#x660E;&#x306E;&#x6587;&#x66F8;&#x3092;&#x9001;&#x4ED8;&#x3057;&#x3066;&#x3044;&#x308B;&#x3002;\n</article>\n<span class=\"writer writer-name\">&#x300A;ScanNetSecurity&#x300B;</span>\n\n\n</div></div>",
  "author": null,
  "date_published": "2019-03-04T23:15:11.000Z",
  "lead_image_url": "https://scan.netsecurity.ne.jp/imgs/ogp_f/26698.jpg",
  "dek": "阪南大学は3月4日、同学の専任教員が学生情報等を保存したUSBメモリを紛失したことが判明したと発表した。",
  "next_page_url": null,
  "url": "https://scan.netsecurity.ne.jp/article/2019/03/05/42049.html",
  "domain": "scan.netsecurity.ne.jp",
  "word_count": 6,
  "direction": "ltr",
  "total_pages": 1,
  "rendered_pages": 1
}

null fields

  • author

  • next_page_url

✅ All tests passed

@kik0220 kik0220 deleted the feat-scan-netsecurity-ne-jp-extractor branch April 9, 2019 14:40
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants