ｷﾀ━━━━━... のスレッド詳細 20/03/06(金)00:49:46のログ

20/03/06(金)00:49:46 No.668678422

ｷﾀ━━━━━━(ﾟ∀ﾟ)━━━━━━ !!!!!

1 20/03/06(金)00:51:38 No.668678932

そのデータをどういう風に扱いたいかによるんじゃない？

2 20/03/06(金)00:52:54 No.668679304

横断検索したいんじゃないの？

3 20/03/06(金)00:54:28 No.668679765

SQLで引っ張り出したいならリストにして格納する奴は殺したくなる JAVAは知らん

4 20/03/06(金)00:55:42 No.668680097

自分ならツイートだけKVSでツイートID:ツイート内容のやつを作るかな

5 20/03/06(金)00:55:56 No.668680158

どういう風に使うかによる

6 20/03/06(金)00:57:52 No.668680708

sql?nosql?

7 20/03/06(金)00:58:12 No.668680795

一つのフィールドに1ユーザー分の全ツイートをリストにして突っ込むって事？それDBの利点潰してると思うからやめた方がいい

8 20/03/06(金)00:59:47 No.668681170

あとで探すだけならRDBじゃなくてKVSの方が無難じゃ今は一応json型もあるけど

9 20/03/06(金)01:00:16 No.668681266

新しいツイートが発生した時にどう更新するか考えたら自然と答え出ない？

10 20/03/06(金)01:01:19 No.668681522

更新頻度低くて取得するとき必ず全ツイート取得と決まってて可能な限りレコード数減らしたいならリストでもいいと思うそうでもなければ個別のレコードにした方がいい

11 <a href="mailto:s">20/03/06(金)01:01:34</a> [s] No.668681595

ユーザーAのツイートから特定キーワード（複数ある）で抽出するような使い方をしたいツイート毎に別々にした方がいいかな使うのはPythonとSQLiteにするつもり

12 20/03/06(金)01:01:35 No.668681605

素直にIDをキーにして発言と日時をログっちゃダメなのかそんな容量食うのか

13 20/03/06(金)01:01:52 No.668681665

作品の評価見るのにやってみたいとか前に言ってたやつか

14 20/03/06(金)01:01:53 No.668681666

>自分ならツイートだけKVSでツイートID:ツイート内容のやつを作るかなどう言うふうに扱いたいかにもよるけど俺もパッと思いついたのはこれだな

15 20/03/06(金)01:03:42 No.668682164

KVS…そういうのもあるのか揮発しない辞書みたいなものと思えばいいのかな？IDとツイート内容さえ取得できればいいからこれ使えばいいかな

16 20/03/06(金)01:04:02 No.668682271

>ユーザーAのツイートから特定キーワード（複数ある）で抽出するような使い方をしたいこれなら紐付けようにID使う形でツイート毎に別でデータ格納するのがいいだろうなというかそれ以外の方法取るならSQLまで使ってやることじゃねぇと思う

17 20/03/06(金)01:04:48 No.668682506

形態素解析したいなら日時でくくってログ引き出せるようにしないとマジでひたすらめんどうになるから ID：発言内容：日時で1ログ取るようにしたほうがいい形態素分析は発言ログに対して個別にかければいい

18 20/03/06(金)01:06:01 No.668682811

一回思いついた方法でやってみて何かおかしいって思うところまで作ってみないと良い方法が何故良い方法なのか理解できなかったりするからとりあえず作れ

19 20/03/06(金)01:09:29 No.668683752

>ユーザーAのツイートから特定キーワード（複数ある）で抽出するような使い方をしたい特定キーワードって増えたり減ったりする？

20 20/03/06(金)01:10:52 No.668684121

作品名（ポケモンとか）の関連キーワード（ピカチュウとか）をGoogleのサジェストから取得 ↓ 特定ユーザーのツイートを取得 ↓ 関連キーワードでツイートを検索してキーワードに関連するツイートだけを抽出するやりたい事はこんな感じなんだけど伝わるだろうか今のところ作品毎に関連キーワード、ユーザー毎にツイートのcsvファイルを別々に作って上記の機能は実現してるんだけど、データベースにまとめたいなってあと作品問わず出現する関連キーワード（グッズとか声優とか）を除外するような仕組みも作りたい

21 20/03/06(金)01:12:17 No.668684502

SQL書いたほうがいいんじゃないかな…

22 20/03/06(金)01:14:27 No.668685038

ユーザーIDとツイートでカラム分けるだけでいいんじゃあ

23 20/03/06(金)01:15:39 No.668685303

いっそプレーンテキストでもいい

24 <a href="mailto:s">20/03/06(金)01:15:58</a> [s] No.668685358

ありがとうID:ツイート内容:日時でSQL作ってみる

25 20/03/06(金)01:16:07 No.668685391

サジェスト語のテーブルとID:発言のテーブル作ってSQLのWHERE句で書けば全部解決しそうなんだけどそんなにSQL書くの嫌なの？って気持ちになる

26 20/03/06(金)01:18:37 No.668686038

>そんなにSQL書くの嫌なの？って気持ちになる前立ってたスレ読んだ限りだとSQLで何が出来るかも分かってない様子だったからそう言うわけではないと思う頑張って勉強しろとは思う

27 20/03/06(金)01:18:39 No.668686044

ﾋの場合 https://twitter.com/id/status/0000000000000000000 みたいにツイート毎にユニークな値振られてるから最後のステータス拾えば良いんじゃね

28 20/03/06(金)01:18:42 No.668686057

まずpythonでDBアクセスとか操作できるようになってから考えた方がいいんじゃないかな…

29 20/03/06(金)01:19:00 No.668686118

>ユーザーIDとツイートでカラム分けるだけでいいんじゃあツイートのタイムスタンプぐらいはほしいところだな

30 20/03/06(金)01:19:16 No.668686197

個人に粘着するくらいの用途しか思い浮かばなくて怖い…

31 20/03/06(金)01:20:24 No.668686457

ﾋのデータ取得ってtwitterAPI使うの？確かあれjsonで取得だよね

32 20/03/06(金)01:20:34 No.668686502

はい「」勉強します…

33 20/03/06(金)01:22:06 No.668686841

確かにRDB弄ったことないまま聞いてるからおかしな事になってる気はするまずは繋いで適当なデータ入れて遊んでみなよ

34 20/03/06(金)01:25:04 No.668687568

>ツイート毎に別データとするの普通はこれだろ >ユーザー毎の全ツイートをリストに格納してひとつのデータにするのこっちはたぶん重くて使い物にならなくなるし扱いにくいぞ

35 20/03/06(金)01:26:49 No.668687936

最初はDB環境用意してA5とかで接続するだけでも一苦労だったりするからな

36 20/03/06(金)01:26:49 No.668687938

twitterAPIが返すデータフォーマットままをDBに突っ込んで使い方考えたほうがいいと思う…

37 20/03/06(金)01:26:51 No.668687953

普通にTwitterで出来る検索以上のものができなさそう

38 20/03/06(金)01:27:58 No.668688202

>普通にTwitterで出来る検索以上のものができなさそうそのあとpandasでちょっと加工して形態素解析にかける下準備だろユーザーを絞る理由まではちょっと見えないけど

39 20/03/06(金)01:29:03 No.668688447

>ユーザーを絞る理由まではちょっと見えないけど単純に自分が好ましい話題を多く話す人を絞り込みたいだけじゃねえの？なぜそう勘繰る

40 20/03/06(金)01:31:08 No.668688883

>単純に自分が好ましい話題を多く話す人を絞り込みたいだけじゃねえの？ >なぜそう勘繰る対象ユーザーが恣意的になりそうで意味あんのかなーとは思うこの手の分析はちょっとした違いが敏感に出すぎて難しいんだよね経験上いや話題と全く関係ないのですいませんなんだけど…

41 20/03/06(金)01:31:31 No.668688971

形態素解析とかする予定なのか単純にキーワードで部分一致取るくらいなのかと

42 20/03/06(金)01:31:33 No.668688982

何件格納するのかによるだろうなパフォーマンス次第で設計は変わってくる

43 20/03/06(金)01:33:11 No.668689320

>なぜそう勘繰る >やりたい事はこんな感じなんだけど伝わるだろうかが「なんのために？」って部分を抜かして方法を語りだすからちょっと怖ッ…って

44 20/03/06(金)01:34:01 No.668689514

RDBに入れてSQLで検索でもいいしKVSにjsonぶっこんでアプリ側で処理でもどっちでも実現できるけどどんくらいデータ集めてどんくらいの頻度で抽出するかによって最適な設計は変わるので両方のパターンで試してみるのが勉強になっていいよ

45 20/03/06(金)01:34:20 No.668689593

>形態素解析とかする予定なのか >単純にキーワードで部分一致取るくらいなのかと意味のないツイート省くために絞るって理解だけど勘繰りすぎかな… とりあえず抽出にそういう細かいチューニングが必要ならSQLマストだと思うリストなんてもってのほかすぎる

46 20/03/06(金)01:35:12 No.668689840

とりあえずクソでもいいから作って人に見せるのが一番成長できると思う

47 20/03/06(金)01:37:30 No.668690350

多分今ここで話されている内容以前のレベルから考えないといけないだろうな… しかし0から理解するには何かしら手本がないとキツそう

48 20/03/06(金)01:38:45 No.668690647

ちなみに10万件くらいまでだったらテキストファイルに格納するだけでも実用的な速度でるぞ場合によってはデータベース使うより速い

49 20/03/06(金)01:40:15 No.668691054

アフィまとめブログの自動生成を勉強するといいぞ！

50 20/03/06(金)01:43:13 No.668691846

3時からプログラムさらさら祭を行い続ければスキルが跳ね上がるかも知れないメモ帳の作り方が洗練されるだけかも知れない

51 20/03/06(金)01:44:20 No.668692044

なんでスレ爆失敗してんの

52 20/03/06(金)01:47:12 No.668692628

なんで爆破…？

虹裏img歴史資料館

20/03/06(金)00:49:46 ｷﾀ━━━━━... のスレッド詳細