VPCのトラフィックミラーリングを試す
21{icon} {views} ALB経由のWebサーバー通信をVPCのトラフィックミラーリング機能で複製し、別EC2でパケットをキャプチャする手順をTerraformで組み上げる方法を紹介。フィルターやセッション設定 […]...
AWS Transit Gatewayでのマルチリージョン接続とRoute Analyzer活用
12{icon} {views} Transit Gatewayを用いた複数VPC・複数リージョン間の接続構成と、その設定手順を解説。Network ManagerのRoute Analyzerを併用することで、ルートの […]...
ALBで送信IPアドレスベースのルーティングを試す
12{icon} {views} ALBのリスナールールでソースIPを指定し、WAFを使わずに簡易的なアクセス制限を行える。Terraformにより特定IP向けの固定レスポンスルールを設定し、EC2インスタンスから動作を […]...
LLMの推論システムの定式化(2):価格理論の推論速度の統合
47{icon} {views} LLM推論にかかるGPUインスタンス料金やトークン生成速度、サービス提供単価などを数式で統合し、黒字化の条件を理論的に示した。実験結果では、GPU以外のボトルネックの影響は小さく、高い稼 […]...
LLMの推論システムの定式化(1):GPU以外のボトルネック
161{icon} {views} LLM推論時にGPU以外が占める遅延要因(SQSのバッチ処理やログ書き込み等)を実験的に検証し、オーバーヘッドは入力トークン数に対してほぼ線形に近似できることを示した。トークナイザーの […]...
Auto Scaling Groupの「Stoppedウォームプール」を試す
26{icon} {views} Auto Scaling GroupのStopped状態のウォームプールを利用することで、初回セットアップを終えたインスタンスを停止したまま待機させ、必要時に素早く起動できる。Activ […]...
ElastiCache RedisでEC2からPub/Subを試す(Redis OSS)
40{icon} {views} EC2からTerraformで構築したRedisにPub/Subを行い、ミリ秒レベルの遅延を検証した。ValkeyではなくOSS版Redisを用いつつ、コードサンプルを通じてシンプルかつ […]...
CloudFormationのメタデータでEC2ユーザーデータの制限を回避する
23{icon} {views} CloudFormationのMetadata機能を使い、EC2にYAML形式で構成を適用することでユーザーデータの16KB制限を回避できる。Terraformと組み合わせてPyTorc […]...
AWS Configを使ってCloudFormationのドリフトを検知する
35{icon} {views} AWS Configを活用し、CloudFormationスタックのドリフトを自動的に「非準拠」として検知・管理する手順を解説した記事です。ルール設定自体よりも、RecorderやIAM […]...
S3バッチオペレーションで大量ファイルを一括変換する
33{icon} {views} AWS S3バッチオペレーションを使い、Lambdaで数万の画像を一気にリサイズする実装手順を紹介。料金やIAMロールの設定、Terraformによるデプロイ手順など、実運用に役立つポイ […]...