【Ruby】HTMLのテーブルで、ヘッダが〇〇の項目の値を取得する
<table> <tbody> : <tr> <th>営業時間</th> <td>10:00 ~ 20:00</td> </tr> : :
というhtmlがあった際に、10:00 ~ 20:00という部分を取り出すには:
require 'nokogiri' #html パーサ nk = Nokogiri.html(open(url)) hour = nk.xpath(//th[.='営業時間']/../td).text # hour => '10:00 ~ 20:00'