虹裏img歴史資料館 - imgの文化を学ぶ

ここでは虹裏imgのかなり古い過去ログを閲覧することができます。

  • iOSアプリ 虹ぶら AppStoreで無料配布中
  • キタ━━━━━... のスレッド詳細

    削除依頼やバグ報告はメールフォームにお願いします。 個人情報,名誉毀損,侵害等について積極的に削除しますので、メールフォームより該当URLをご連絡いただけると助かります

    20/03/06(金)00:49:46 No.668678422

    キタ━━━━━━(゚∀゚)━━━━━━ !!!!!

    1 20/03/06(金)00:51:38 No.668678932

    そのデータをどういう風に扱いたいかによるんじゃない?

    2 20/03/06(金)00:52:54 No.668679304

    横断検索したいんじゃないの?

    3 20/03/06(金)00:54:28 No.668679765

    SQLで引っ張り出したいならリストにして格納する奴は殺したくなる JAVAは知らん

    4 20/03/06(金)00:55:42 No.668680097

    自分ならツイートだけKVSでツイートID:ツイート内容のやつを作るかな

    5 20/03/06(金)00:55:56 No.668680158

    どういう風に使うかによる

    6 20/03/06(金)00:57:52 No.668680708

    sql?nosql?

    7 20/03/06(金)00:58:12 No.668680795

    一つのフィールドに1ユーザー分の全ツイートをリストにして突っ込むって事? それDBの利点潰してると思うからやめた方がいい

    8 20/03/06(金)00:59:47 No.668681170

    あとで探すだけならRDBじゃなくてKVSの方が無難じゃ 今は一応json型もあるけど

    9 20/03/06(金)01:00:16 No.668681266

    新しいツイートが発生した時にどう更新するか考えたら自然と答え出ない?

    10 20/03/06(金)01:01:19 No.668681522

    更新頻度低くて取得するとき必ず全ツイート取得と決まってて可能な限りレコード数減らしたいならリストでもいいと思う そうでもなければ個別のレコードにした方がいい

    11 20/03/06(金)01:01:34 [s] No.668681595

    ユーザーAのツイートから特定キーワード(複数ある)で抽出するような使い方をしたい ツイート毎に別々にした方がいいかな 使うのはPythonとSQLiteにするつもり

    12 20/03/06(金)01:01:35 No.668681605

    素直にIDをキーにして発言と日時をログっちゃダメなのか そんな容量食うのか

    13 20/03/06(金)01:01:52 No.668681665

    作品の評価見るのにやってみたいとか前に言ってたやつか

    14 20/03/06(金)01:01:53 No.668681666

    >自分ならツイートだけKVSでツイートID:ツイート内容のやつを作るかな どう言うふうに扱いたいかにもよるけど俺もパッと思いついたのはこれだな

    15 20/03/06(金)01:03:42 No.668682164

    KVS…そういうのもあるのか 揮発しない辞書みたいなものと思えばいいのかな?IDとツイート内容さえ取得できればいいからこれ使えばいいかな

    16 20/03/06(金)01:04:02 No.668682271

    >ユーザーAのツイートから特定キーワード(複数ある)で抽出するような使い方をしたい これなら紐付けようにID使う形でツイート毎に別でデータ格納するのがいいだろうな というかそれ以外の方法取るならSQLまで使ってやることじゃねぇと思う

    17 20/03/06(金)01:04:48 No.668682506

    形態素解析したいなら日時でくくってログ引き出せるようにしないとマジでひたすらめんどうになるから ID:発言内容:日時で1ログ取るようにしたほうがいい 形態素分析は発言ログに対して個別にかければいい

    18 20/03/06(金)01:06:01 No.668682811

    一回思いついた方法でやってみて何かおかしいって思うところまで作ってみないと良い方法が何故良い方法なのか理解できなかったりするからとりあえず作れ

    19 20/03/06(金)01:09:29 No.668683752

    >ユーザーAのツイートから特定キーワード(複数ある)で抽出するような使い方をしたい 特定キーワードって増えたり減ったりする?

    20 20/03/06(金)01:10:52 No.668684121

    作品名(ポケモンとか)の関連キーワード(ピカチュウとか)をGoogleのサジェストから取得 ↓ 特定ユーザーのツイートを取得 ↓ 関連キーワードでツイートを検索してキーワードに関連するツイートだけを抽出する やりたい事はこんな感じなんだけど伝わるだろうか 今のところ作品毎に関連キーワード、ユーザー毎にツイートのcsvファイルを別々に作って上記の機能は実現してるんだけど、データベースにまとめたいなって あと作品問わず出現する関連キーワード(グッズとか声優とか)を除外するような仕組みも作りたい

    21 20/03/06(金)01:12:17 No.668684502

    SQL書いたほうがいいんじゃないかな…

    22 20/03/06(金)01:14:27 No.668685038

    ユーザーIDとツイートでカラム分けるだけでいいんじゃあ

    23 20/03/06(金)01:15:39 No.668685303

    いっそプレーンテキストでもいい

    24 20/03/06(金)01:15:58 [s] No.668685358

    ありがとうID:ツイート内容:日時でSQL作ってみる

    25 20/03/06(金)01:16:07 No.668685391

    サジェスト語のテーブルとID:発言のテーブル作ってSQLのWHERE句で書けば全部解決しそうなんだけど そんなにSQL書くの嫌なの?って気持ちになる

    26 20/03/06(金)01:18:37 No.668686038

    >そんなにSQL書くの嫌なの?って気持ちになる 前立ってたスレ読んだ限りだとSQLで何が出来るかも分かってない様子だったからそう言うわけではないと思う 頑張って勉強しろとは思う

    27 20/03/06(金)01:18:39 No.668686044

    ヒの場合 https://twitter.com/id/status/0000000000000000000 みたいにツイート毎にユニークな値振られてるから最後のステータス拾えば良いんじゃね

    28 20/03/06(金)01:18:42 No.668686057

    まずpythonでDBアクセスとか操作できるようになってから考えた方がいいんじゃないかな…

    29 20/03/06(金)01:19:00 No.668686118

    >ユーザーIDとツイートでカラム分けるだけでいいんじゃあ ツイートのタイムスタンプぐらいはほしいところだな

    30 20/03/06(金)01:19:16 No.668686197

    個人に粘着するくらいの用途しか思い浮かばなくて怖い…

    31 20/03/06(金)01:20:24 No.668686457

    ヒのデータ取得ってtwitterAPI使うの? 確かあれjsonで取得だよね

    32 20/03/06(金)01:20:34 No.668686502

    はい「」勉強します…

    33 20/03/06(金)01:22:06 No.668686841

    確かにRDB弄ったことないまま聞いてるからおかしな事になってる気はする まずは繋いで適当なデータ入れて遊んでみなよ

    34 20/03/06(金)01:25:04 No.668687568

    >ツイート毎に別データとするの 普通はこれだろ >ユーザー毎の全ツイートをリストに格納してひとつのデータにするの こっちはたぶん重くて使い物にならなくなるし扱いにくいぞ

    35 20/03/06(金)01:26:49 No.668687936

    最初はDB環境用意してA5とかで接続するだけでも一苦労だったりするからな

    36 20/03/06(金)01:26:49 No.668687938

    twitterAPIが返すデータフォーマットままをDBに突っ込んで使い方考えたほうがいいと思う…

    37 20/03/06(金)01:26:51 No.668687953

    普通にTwitterで出来る検索以上のものができなさそう

    38 20/03/06(金)01:27:58 No.668688202

    >普通にTwitterで出来る検索以上のものができなさそう そのあとpandasでちょっと加工して形態素解析にかける下準備だろ ユーザーを絞る理由まではちょっと見えないけど

    39 20/03/06(金)01:29:03 No.668688447

    >ユーザーを絞る理由まではちょっと見えないけど 単純に自分が好ましい話題を多く話す人を絞り込みたいだけじゃねえの? なぜそう勘繰る

    40 20/03/06(金)01:31:08 No.668688883

    >単純に自分が好ましい話題を多く話す人を絞り込みたいだけじゃねえの? >なぜそう勘繰る 対象ユーザーが恣意的になりそうで意味あんのかなーとは思う この手の分析はちょっとした違いが敏感に出すぎて難しいんだよね経験上 いや話題と全く関係ないのですいませんなんだけど…

    41 20/03/06(金)01:31:31 No.668688971

    形態素解析とかする予定なのか 単純にキーワードで部分一致取るくらいなのかと

    42 20/03/06(金)01:31:33 No.668688982

    何件格納するのかによるだろうな パフォーマンス次第で設計は変わってくる

    43 20/03/06(金)01:33:11 No.668689320

    >なぜそう勘繰る >やりたい事はこんな感じなんだけど伝わるだろうか が「なんのために?」って部分を抜かして方法を語りだすからちょっと怖ッ…って

    44 20/03/06(金)01:34:01 No.668689514

    RDBに入れてSQLで検索でもいいしKVSにjsonぶっこんでアプリ側で処理でもどっちでも実現できるけどどんくらいデータ集めてどんくらいの頻度で抽出するかによって最適な設計は変わるので両方のパターンで試してみるのが勉強になっていいよ

    45 20/03/06(金)01:34:20 No.668689593

    >形態素解析とかする予定なのか >単純にキーワードで部分一致取るくらいなのかと 意味のないツイート省くために絞るって理解だけど勘繰りすぎかな… とりあえず抽出にそういう細かいチューニングが必要ならSQLマストだと思う リストなんてもってのほかすぎる

    46 20/03/06(金)01:35:12 No.668689840

    とりあえずクソでもいいから作って人に見せるのが一番成長できると思う

    47 20/03/06(金)01:37:30 No.668690350

    多分今ここで話されている内容以前のレベルから考えないといけないだろうな… しかし0から理解するには何かしら手本がないとキツそう

    48 20/03/06(金)01:38:45 No.668690647

    ちなみに10万件くらいまでだったらテキストファイルに格納するだけでも実用的な速度でるぞ 場合によってはデータベース使うより速い

    49 20/03/06(金)01:40:15 No.668691054

    アフィまとめブログの自動生成を勉強するといいぞ!

    50 20/03/06(金)01:43:13 No.668691846

    3時からプログラムさらさら祭を行い続ければスキルが跳ね上がるかも知れない メモ帳の作り方が洗練されるだけかも知れない

    51 20/03/06(金)01:44:20 No.668692044

    なんでスレ爆失敗してんの

    52 20/03/06(金)01:47:12 No.668692628

    なんで爆破…?